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Prefacio 


Al principio era la información. La palabra vino después. El paso de la 
una a la otra se logró por la evolución de organismos con la capacidad de 
explotar de forma selectiva esta información para sobrevivir y perpetuar 
su especie. 

Es frecuente pensar en la información como algo que llegó mucho más 
tarde al panorama evolutivo, es decir, como algo que depende de los es- 
fuerzos interpretativos de la vida inteligente y, por tanto, de su existencia 
previa. De acuerdo con esta perspectiva, algo sólo se convierte en infor- 
mación cuando algún agente cognitivo le asigna una significación, es de- 
cir, lo interpreta como un signo. La belleza está en el ojo del observador, 
y la información está en la cabeza del que la recibe. Hablar de la informa- 
ción como algo que está ahí afuera —es decir, algo independiente del uso 
real o potencial que le dé algún intérprete—, y que es anterior a la apari- 
ción histórica de la vida inteligente, es mala metafísica. La información es 
un artefacto, es decir, una forma de describir la significación que, para 
algún agente, tienen los sucesos, que carecen de un significado intrínseco. 
Atribuimos significado a los estímulos, pero, al margen de esta atribución, 
son estériles desde un punto de vista informativo. 

Esta es una manera de pensar sobre la información; una manera que se 
basa en una confusión, a saber, la confusión de la información con el sig- 
nificado. Una vez se ha entendido claramente esta distinción, queda uno 
libre para pensar en la información (aunque no en el significado) como un 
producto objetivo, como algo cuya generación, transmisión y recepción no 
requiere, o no presupone en ninguna medida, procesos interpretativos. Se 
dispone entonces de un marco conceptual para comprender el modo en que 
puede producirse el significado, es decir, la manera en que pueden desa- 
rrollarse sistemas cognitivos genuinos (aquellos que tienen recursos para 
interpretar señales, mantener creencias y adquirir conocimiento), a partir 
de mecanismos de nivel inferior, puramente físicos, que procesan infor- 
mación. Los logros de nivel superior asociados con la vida inteligente se 
pueden ver entonces como manifestaciones de formas progresivamente 
más eficientes de manipular y codificar la información. El significado y la 
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constelación de actitudes mentales asociadas que lo manifiestan son pro- 
ductos manufacturados. La información es el material bruto. 

Esta es, en términos muy amplios, la tesis del presente trabajo. Parece 
ambiciosa. Demasiado ambiciosa: algo que sólo un filósofo, ignorante de 
cuán poco es lo que se sabe sobre estos temas, podría proponer seriamente. 
Permítaseme, por tanto, matizarla diciendo que lo que he descrito es el 
objetivo al que aspiro, no, quizás, el objetivo que he logrado alcanzar. Los 
lectores podrán juzgar por ellos mismos hasta qué punto he estado cerca 
de mi propósito. 

Se suele oír hablar sobre información a los psicólogos cognitivos y a 
los informáticos, no a los filósofos. Científicamente hablando —o, al me- 
nos, esto es lo que parecería, a juzgar por los últimos treinta años— las 
proezas cognitivas de una persona o un computador han de entenderse en 
términos de complejos procesos que manipulan información. Por otra 
parte, los filósofos parecen todavía dispuestos a pensar sobre el conoci- 
miento, la percepción, la memoria y la inteligencia con un conjunto com- 
pletamente diferente de instrumentos analíticos: evidencia, razones, justi- 
ficación, creencia, certeza e inferencia. Consecuentemente, hay un pro- 
blema serio de comunicación. Los filósofos articulan teorías del conoci- 
miento que, desde el punto de vista de las ciencias cognitivas, no parecen 
ser importantes para los mejores modelos disponibles de la percepción, el 
aprendizaje y el reconocimiento. Y los filósofos (con alguna notable ex- 
cepción) tienden a ignorar, menospreciar y rechazar los programas de 
computador, diagramas de flujo y circuitos eléctricos de realimentación 
del científico como pura ganga empírica frente a su pura mena conceptual. 
Sin un vocabulario común con el que afrontar estos temas, es inevitable 
esta clase de aislamiento. El resultado es, en mi opinión, el empobreci- 
miento de ambos. 

En realidad, ésta es una de las razones de que haya elegido el concepto 
de información como idea central con la que organizar este estudio filosó- 
fico. Si ha de haber contacto entre la filosofía y el abundante material per- 
tinente que tienen las ciencias cognitivas, entonces se deben construir 
puentes, aunque sólo sean puentes terminológicos, entre los análisis filo- 
sóficos del conocimiento, la creencia y la percepción y las disciplinas cien- 
tíficas que tratan con las mismas dimensiones de nuestra vida mental. 

Por supuesto, está de moda hablar de la información. Los anuncios de 
las revistas nos recuerdan que vivimos en la Era de la Información. Por lo 
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tanto, puedo ser acusado de que meramente he adoptado una forma termi- 
nológica caprichosa en que encajar una sustancia filosófica nada elegante. 
Hasta cierto punto, me confieso culpable frente a tal acusación. He adop- 
tado, para fines filosóficos, una manera de hablar que se ha convertido en 
dominante en las ciencias cognitivas en las últimas décadas. Aunque eso 
no es todo lo que he intentado hacer. También he tratado de situar esta 
forma de hablar en una posición respetable desde un punto de vista filosó- 
fico con el propósito de iluminar algunas áreas oscuras de la epistemología 
y la filosofía de la mente. 

Es más fácil hablar de información que explicar de qué se está ha- 
blando. Un sorprendente número de libros, y aquí incluyo los libros de 
texto, tienen la palabra información en su título sin tomarse la molestia de 
incluirla en su índice. Ha llegado a ser una palabra comodín, una palabra 
que tiene el suficiente poder de sugestión para satisfacer toda una serie de 
explicaciones. Su utilización en telecomunicación y en la tecnología 
computacional le confiere el aura de algo duro y técnico, y, sin embargo, 
sigue siendo lo suficientemente esponjosa, flexible y amorfa como para 
poder contribuir a estudios cognitivos y semánticos. Al pensar en la infor- 
mación, se tiende a pensar en algo objetivo y cuantificable —por ejemplo, 
las pulsaciones eléctricas que se deslizan por un alambre de cobre— y, al 
propio tiempo, en algo más abstracto, en las noticias o el mensaje que 
transmiten esas pulsaciones, algo que no es tan claramente objetivo y cuan- 
tificable. Esta ambigiiedad es útil para muchos fines. Le permite a uno ha- 
blar, por ejemplo, de que la información se recoge, se procesa y se trans- 
mite a los centros cognitivos superiores en los que se utiliza para controlar 
la respuesta de un organismo a su entorno. Se nos da la imagen de células 
que se comunican unas con otras de un modo parecido al que usted y yo 
utilizamos para comunicarnos. Los esfuerzos cognitivos de un organismo 
comienzan a sonar como proyectos comunitarios que emprenden locuaces 
neuronas. Tales son las imágenes que alimenta la conveniente ambigiiedad 
de los términos usados para describir esos procesos. 

Para los propósitos de la filosofía se necesita algo mejor. No es que la 
filosofía sea más precisa, exacta o exigente que sus primas las ciencias. Al 
contrario, en muchos aspectos efectúa sus vuelos teóricos con muchas me- 
nos restricciones. Este libro ilustra este punto. Y, sin embargo, los proble- 
mas que caracterizan los estudios filosóficos son sensibles a las cuestiones 
conceptuales de un modo que les es único. Conseguir aclarar lo que uno 
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quiere decir es un primer paso esencial; las palabras son los instrumentos 
del filósofo, y si no están bien afiladas tan sólo servirán para desfigurar el 
material. 

Por todo ello impulso este estudio examinando en la primera parte la 
noción de información. Empiezo repasando algunas de las ideas funda- 
mentales de la teoría de la comunicación. Esta es una manera útil de co- 
menzar, pero no porque esta teoría —en su interpretación y aplicación 
usuales— nos diga lo que es la información, que es algo que no hace y que 
ni siquiera intenta. Empiezo ahí porque la estructura subyacente de esta 
teoría, cuando se la suplementa adecuadamente, puede adaptarse para la 
formulación de una teoría de la información auténticamente semántica, es 
decir, una teoría de la información que pueda usarse en estudios semánti- 
cos y cognitivos. Si, de acuerdo con la teoría de la comunicación, conce- 
bimos la información como algo objetivo, como algo que se define en tér- 
minos de una red de relaciones nómicas que se dan entre eventos y estruc- 
turas distintos, se puede, o al menos eso es lo que argumentaré, desarrollar 
un análisis plausible y teoréticamente poderoso del contenido informativo 
de una señal. 

La segunda parte es un intento de aplicar esta idea de la información a 
diversas cuestiones de la teoría del conocimiento. El conocimiento se iden- 
tifica con la creencia basada en la información. Sigue a esto una referencia 
al escepticismo. Se le da un nuevo sesgo al desafío escéptico formulando 
la disputa en términos de diferentes criterios para distinguir entre la infor- 
mación que recibimos por un canal y el canal mismo por el cual recibimos 
tal información. Finalmente, en el capítulo 6 intento distinguir los procesos 
sensoriales, por un lado, de los procesos cognitivos, por el otro —la dife- 
rencia entre ver un pato y reconocerlo como pato—, en términos del modo 
diferente en que se codifica la información acerca del pato. Los procesos 
sensoriales son por naturaleza analógicos; los procesos cognitivos son di- 
gitales. 

La parte final de este libro, la tercera, se dedica al análisis de la creen- 
cia, los conceptos y el significado (en la medida en que éste se entiende 
como propiedad de nuestros estados psicológicos). Francamente, estos tres 
capítulos son los que me inspiran mayores recelos. Hay tantas cosas perti- 
nentes que ignoro —por ejemplo, parte de los trabajos de la psicología 
evolutiva—, que estoy preparado para recibir las críticas a ciertos puntos 
de este análisis por ser fácticamente inadecuados: dados los estudios A, B 
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y C, simplemente no es éste, o no podría serlo, el modo en que las cosas 
ocurren en realidad. Sin embargo, argumentaré que, si bien los detalles 
pueden estar equivocados, el marco teórico general tiene que ser correcto. 
Si los sistemas físicos pueden desarrollar conceptos, con la consiguiente 
capacidad de tener creencias —tanto verdaderas como falsas—, es decir, 
si tales sistemas pueden representar o representar erróneamente el estado 
de su entorno, entonces las estructuras internas que puedan calificarse de 
creencias o representaciones deben desarrollarse de un modo parecido al 
que describo. No veo ningún otro modo en que se pueda producir el signi- 
ficado, el tipo de contenido que adscribimos a los estados internos cuando 
atribuimos conocimientos y creencias. 

Todo este proyecto puede contemplarse como un ejercicio de filosofía 
naturalista o, si se prefiere, de metafísica materialista: ¿puede hacerse una 
tarta mental utilizando sólo harina y levadura físicas? La respuesta argu- 
mentada es que se puede hacer. Dado el tipo de información descrito en la 
primera parte, algo que los materialistas reflexivos deberían estar dispues- 
tos a conceder, tenemos todos los ingredientes necesarios para entender la 
naturaleza y la función de nuestras actitudes cognitivas, es decir, todo lo 
que es necesario para entender el modo en que sistemas puramente físicos 
podrían albergar estados que tengan un contenido (significado) caracterís- 
tico del conocimiento y la creencia. Por supuesto, esto no muestra que los 
seres humanos no sean más que sistemas físicos complejos, que la mente 
sea realmente material, pero sí muestra que no es necesario concebirlos de 
otra forma para entender una faceta de nuestra vida mental, la que tiene 
que ver con nuestras capacidades cognitivas. 


FRED I. DRETSKE 


Universidad de Wisconsin 
1979 
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1. La teoría de la comunicación 


La teoría matemática de la información, o teoría de la comunicación!, 
proporciona una medida de la cantidad de información asociada con un 
determinado estado de cosas y, a la vez, una medida del grado en que esta 
información se transmite a otros puntos y, por tanto, es asequible en ellos. 
Esta teoría es puramente cuantitativa. Se ocupa de cantidades de informa- 
ción, no de la información contenida en esas cantidades, a no ser de forma 
indirecta y como consecuencia. 

Eso es lo que parece deducirse del nombre de la teoría. Pretende ser 
una teoría de la información y su expresión matemática sugiere que se 





| Con la expresión «la teoría matemática de la información» (o «teoría de la comunicación» 
para distinguirla de la teoría semántica de la información desarrollada en el capítulo 3) me 
referiré siempre a la teoría asociada al artículo de Claude Shannon «The Mathematical 
Theory of Communication», Bell System Technical Journal, julio y octubre de 1948 (reim- 
preso con el mismo título y un ensayo introductorio de Warren Weaver por la University of 
Illinois Press, 1949). Como señala Yehoshua Bar-Hillel («An Examination of Information 
Theory», Philosophy of Science, vol. 22 (1955), págs. 86-105), en algún momento entre 1928 
y 1948, los ingenieros y matemáticos estadounidenses empezaron a hablar de «teoría de la 
información», refiriéndose de una forma vaga y aproximada a una teoría cuyo concepto bá- 
sico es el de «cantidad de información» de Hartley (véase R. V. L. Hartley, «Transmission 
of Information», Bell System Technical Journal, vol. 7 (1928), págs. 535-563). Hartley fue 
un precursor de Shannon, y su concepto de «cantidad de información» es el mismo de Shan- 
non, pero en una forma menos desarrollada. Como sigue diciendo Bar-Hillel, hacia mediados 
de los años cuarenta, Norbert Wiener y Shannon también usaban esta terminología, si bien 
en Gran Bretaña las cosas se desarrollaban en una dirección distinta. Mientras que en Estados 
Unidos el término «teoría de la información» acabó usándose, por lo menos a partir de 1948 
(probablemente por el impacto de Cybernetics, de Wiener, Nueva York, 1948), como una 
subciencia no muy bien definida de la teoría de la comunicación, el uso británico de este 
término se apartó de la comunicación y lo llevó a un estrecho contacto con la metodología 
científica general. 

Hay, por supuesto, muchos nombres asociados al desarrollo de estas ideas, y no pretendo 
menospreciar esas otras contribuciones usando el nombre de Shannon como una percha en la 
que colgar la teoría. Aparte de Hartley y Wiener, se podría mencionar a Boltzmann, Szilard, 
Nyquist y otros. En E. C. Cherry, «A History of the Theory of Information», Pro- ceedings 
ofthe Institute of Electrical Engineers, vol. 98 (1) (1951), págs. 383-393, se puede encontrar 
una breve historia de la teoría. Esta obra se reimprimió con ligeros cambios bajo el título 
«The Communication Theory of Information» en American Scientist, vol. 40 (1952), págs. 
640-664. 
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ocupa de ésta en su aspecto cuantitativo. Pero ésa es una cuestión polé- 
mica. Algunos expertos aseguran que la teoría de la comunicación no nos 
dice nada sobre la información. Eso no significa que la teoría sea inútil, 
sino sólo que su utilidad no radica en lo que nos dice sobre la información 
o sobre cantidades de información, sino en lo que nos dice sobre otra can- 
tidad que, a pesar de estar relacionada con la anterior, es totalmente dis- 
tinta. Según esta concepción, lo que ocurre es tan sólo que se ha dado a la 
teoría un nombre equivocado. 

Esta acusación no carece de fundamento. Aunque la teoría no ha sido 
mal bautizada, lo cierto es que con frecuencia se ha hecho mal uso de ella, 
en buena parte a causa de su nombre. Dado que este ensayo es un intento 
de desarrollar una teoría del conocimiento basada en la teoría de la infor- 
mación, es esencial aclarar lo que esa teoría nos dice (si es que nos dice 
algo) sobre la información. A tal efecto, voy a hacer en este capítulo una 
breve exposición de algunas de las ideas básicas de la teoría. En capítulos 
posteriores abordaremos la cuestión de si lo que esta teoría nos dice puede 
ser incluido en una auténtica teoría de la información tal como ésta es con- 
cebida en los estudios semánticos y cognitivos. Una respuesta afirmativa 
a esta cuestión sentará las bases para el desarrollo de una auténtica teoría 
semántica de la información y de su aplicación a los temas epistemológi- 
cos y a algunos problemas de la filosofía de la mente. 


Cantidad de información generada 


Hay ocho empleados, uno de los cuales debe realizar cierta tarea des- 
agradable. El jefe delega en el propio grupo la ingrata tarea de seleccionar 
al infortunado individuo, y sólo pide ser informado del resultado una vez 
que se haya tomado la decisión. El grupo busca algún procedimiento que 
considere justo (escoger la paja más larga, echar una moneda al aire) y 
Herman es seleccionado. Escriben el nombre «Herman» en una nota y la 
envían al jefe. 

La teoría de la información identifica la cantidad de información aso- 
ciada a un evento, o generada por él (o la actualización de un estado de 
cosas), con la reducción del grado de incertidumbre, la eliminación de po- 
sibilidades, representada por este suceso o estado de cosas. Al principio 
había ocho candidatos a realizar la tarea. Después estas ocho posibilidades 
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se redujeron a una. Herman fue seleccionado. En un sentido intuitivo de 
«incertidumbre» ya no hay ninguna incertidumbre respecto a quién va a 
hacer el trabajo. Ya se ha hecho la selección. Cuando un conjunto de po- 
sibilidades se reduce de esta manera, la cantidad de información asociada 
está en función del número de posibilidades eliminadas al alcanzar el re- 
sultado. 

Para medir la cantidad de información asociada con la selección de 
Herman, o el hecho de que Herman sea el elegido, podría procederse de 
diversas formas. Se podría decir que la cantidad de información contenida 
en este resultado es 8, ya que la incertidumbre, el número de posibilidades, 
ha sido reducida en un factor de 8. O bien se podría decir que, dado que se 
ha eliminado siete posibilidades, la cantidad de información es 7. Aunque 
es posible medir así la cantidad de información generada por la selección 
de Herman, hay buenas razones para elegir una forma distinta de asignar 
números a esa cantidad. Supongamos que el grupo decide hacer la selec- 
ción lanzando una moneda al aire. A tal efecto, los empleados se dividen 
en dos grupos de cuatro y tiran la moneda para decidir en cuál de los dos 
grupos se hará una posterior selección. Cuando esto se ha decidido me- 
diante un primer lanzamiento de la moneda, el grupo que no ha tenido 
suerte se divide en dos subgrupos, cada uno de los cuales estará formado 
por dos individuos. Un segundo lanzamiento de la moneda decidirá en cuál 
de los dos grupos se realizará la selección final. Al tercer lanzamiento de 
la moneda se resolverá la cuestión entre los dos candidatos restantes, 
siendo Herman el infeliz superviviente. Si tomamos los lanzamientos de 
la moneda como el número de decisiones o selecciones que han tenido 
lugar durante el proceso de reducción del número de candidatos de ocho a 
uno, obtenemos el número 3. Este es el número de decisiones binarias, 
elecciones entre dos posibilidades opuestas, e igualmente probables, que 
deben tomarse para reducir ocho posibilidades a una. Según la teoría de la 
información, ésta es la forma correcta o, por lo menos, conveniente? de 
medir la cantidad de información contenida en la reducción de ocho posi- 
bilidades a una. Puesto que una decisión binaria puede representarse me- 





2 Véase la discusión de Shannon de las razones para elegir una función logarítmica, y, en 
particular, el logaritmo en base 2, como medida de la información: pág. 32 de The Mathema- 
tical Theory of Information. 
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diante un dígito binario (0 o 1), podemos representar la selección de Her- 
man mediante una secuencia de tres dígitos binarios. Se necesitan tres dí- 
gitos binarios (bits) —un dígito binario (0 o 1) por cada lanzamiento de la 
moneda (siendo 1 = cara, O = cruz)— para determinar totalmente la reduc- 
ción de ocho posibilidades a una. La cantidad de información asociada con 
el hecho de que Herman fuera seleccionado es de tres bits. 

Otra forma de ver la cantidad de información incluida en la reducción 
de ocho posibilidades es considerar que los ocho empleados se han divi- 
dido en varias clases naturales de cuatro personas cada una. Supongamos, 
por ejemplo, que cuatro de los empleados son hombres y otros cuatro mu- 
jeres. Cuatro de ellos (dos hombres y dos mujeres) son altos, los otros cua- 
tro, bajos; y, finalmente, cuatro de ellos (un hombre bajo y otro alto, y una 
mujer alta y otra baja) son empleados nuevos, mientras que los otros cuatro 
son antiguos. Si asignamos un dígito binario a cada una de estas clases, y 
1 representa la clase de los hombres, O la de las mujeres, 1 la clase de 
personas altas, O la de las bajas, 1 a los nuevos empleados y O a los anti- 
guos, entonces bastará una secuencia de tres dígitos binarios para designar 
unívocamente a uno de los empleados. Si el primer dígito de la secuencia 
representa el sexo del empleado, el segundo la altura y el tercero la anti- 
gúedad en el empleo. Herman puede ser designado mediante la secuencia 
101, puesto que es hombre (1), bajo (0) y empleado nuevo (1). Usando este 
código, la nota podría haber contenido los símbolos 101 en lugar del nom- 
bre Herman y se hubiera transmitido la misma información al jefe. 

El procedimiento de decisión adoptado por el grupo, el método de lan- 
zar una moneda al aire y eliminar con cada lanzamiento a la mitad de los 
que quedaban, no es más que una forma de dividir artificialmente el grupo 
de tal manera que tres decisiones binarias basten para reducir a una las 
posibilidades. Según esta forma de medir la información, la nota con el 
nombre «Herman» contiene tres bits de información. Si hubiera habido 
cuatro empleados en lugar de ocho, la misma nota habría llevado dos bits 
de información, ya que sólo hubieran sido necesarios dos lanzamientos de 
la moneda para reducir de cuatro a uno el número de candidatos. Y si el 
número de empleados hubiera sido dieciséis, la nota contendría cuatro bits 
de información. Cada vez que doblamos el número de empleados añadi- 
mos un bit de información, dado que al doblar el número de individuos (o 
de posibilidades) hemos de efectuar un lanzamiento más para conseguir la 
misma reducción de posibilidades. 
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Es importante observar que estamos hablando de cantidades de infor- 
mación. Hay tres bits de información asociada a la selección de Herman, 
pero también habría tres bits de información generada por la selección de 
cualquier otro de los siete empleados. Si, por ejemplo, hubiera sido selec- 
cionada Margaret, el resultado cuantitativo hubiera sido el mismo: tres 
bits. Siempre que ocho posibilidades queden reducidas a una, independien- 
temente de cuál sea ésta en concreto, la cantidad de información asociada 
con el resultado es la misma y, dado que la teoría matemática de la infor- 
mación sólo se ocupa de los aspectos cuantitativos de esas situaciones, de 
cantidades de información, el resultado, desde el punto de vista de esta 
teoría, es el mismo tanto si se selecciona a Margaret como si se elige a 
Herman. En ambos casos el resultado del proceso de selección y la nota 
enviada al jefe contendrían exactamente la misma cantidad de informa- 
ción. La teoría de la información no proporciona una forma de distinguir 
entre lo que nosotros consideramos intuitivamente, la diferencia entre la 
información de que ha sido seleccionado Herman y la de que lo ha sido 
Margaret. Esta es una diferencia en cuanto al contenido informativo de un 
estado de cosas (o mensaje), una diferencia que la teoría cuantitativa ig- 
nora. En el capítulo siguiente volveremos a tratar esta importante cuestión. 

Hay una fórmula general para calcular la cantidad de información ge- 
nerada por la reducción de n posibilidades (todas igualmente probables) a 
1. Si s (la fuente) es algún mecanismo o proceso cuyo resultado es la re- 
ducción de n posibilidades igualmente probables a 1, y escribimos /(s) para 
referirnos a la cantidad de información asociada con, o generada por, s, 
entonces: 


(1.1) K(s) =lo0g n 


donde log es el logaritmo en base 2. El logaritmo en base 2 d en no es más 
que la potencia a la que hay que elevar 2 para obtener n. Así, por ejemplo, 
log 4 = 2, porque 2? = 4; log 8 = 3, porque 2* = 8; y log 16 = 4, porque 
2*=16. Por supuesto que los números que no son múltiplos de 2 también 
tienen logaritmos, pero en ese caso se necesitan tablas especiales (o bien 
una calculadora de bolsillo) para obtener el valor de la función. Si, por 
ejemplo, hubiera diez empleados, la cantidad de información asociada con 
la selección de Herman sería aproximadamente de 3,3 bits, puesto que log 
10 =3,3. 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


Este último punto merece un comentario especial, dado que nos obliga 
a distinguir dos cosas muy diferentes: 1) la cantidad de información (en 
bits) generada por un determinado estado de cosas, y 2) el número de dí- 
gitos binarios, es decir, el número de símbolos binarios (como O y 1), que 
se usan para representar, codificar o describir ese estado de cosas. En nues- 
tro ejemplo esos números eran el mismo. La selección de Herman gene- 
raba tres bits de información, y usábamos tres dígitos binarios (101) para 
describir los resultados de esa selección. Una forma de expresarlo es decir 
que codificamos tres bits de información en tres dígitos binarios. Pero ¿y 
si hubiera habido diez empleados y el mensaje hubiera tenido que se codi- 
ficado mediante símbolos binarios (en lugar de usar el nombre Herman)? 
Según la fórmula anterior, la cantidad de información que la elección de 
Herman generaría en ese caso en 3,3 bits. ¿Cómo codificar esa informa- 
ción mediante dígitos binarios? No podemos usar fracciones de símbolo. 
No podemos usar 3/10 del símbolo 1 o 0 para transmitir esa información 
adicional. Es evidente que debemos usar cuatro símbolos (por lo menos) 
para representar o describir un estado de cosas que contenga 3,3 bits de 
información. Se necesitan por lo menos cuatro dígitos binarios para codi- 
ficar menos de cuatro bits de información. No es muy eficaz, pero es lo 
mejor que podemos hacer si insistimos en usar un código binario para co- 
municar cantidades fraccionarias de información. Los teóricos de la infor- 
mación dirían que tal codificación es en cierta medida redundante, ya que 
estamos usando un código (una secuencia de cuatro dígitos binarios) capaz 
de transmitir cuatro bits de información para transmitir solamente 3,3 bits. 
Como veremos más adelante, la redundancia tiene sus ventajas, pero, dado 
que la transmisión de símbolos cuesta dinero, en telecomunicaciones se 
intenta minimizar esta cantidad. 

Si nuestros empleados eligieran comunicarse con su jefe mediante un 
código que utilizase dígitos binarios en lugar de nombres, podrían haber 
elegido un código menos eficaz. Tal como lo hicieron, actuaron con la ma- 
yor eficacia posible, puesto que su mensaje, 101, llevaba tres bits de infor- 
mación. Pero si se hubieran dividido en grupos usando otros criterios, 
usando el primer dígito para representar el color de los ojos (dos de ellos 
tenían los ojos azules, los otros seis, castaños), el segundo dígito el color 
del cabello (tres de ellos eran rubios, cinco castaños), y así sucesivamente, 
seguramente hubieran necesitado cuatro o más dígitos para transmitir la 
información de que Herman había sido seleccionado. Su mensaje podría 
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haber sido 10010, que interpretado significa: hombre de ojos y pelo casta- 
ños, de altura superior al metro ochenta, casado y con gafas. Esta es una 
posible forma de designar a Herman, pero una forma ineficaz. En términos 
informacionales, el mensaje tiene cierto grado de redundancia: se emplean 
cinco dígitos binarios para transmitir únicamente tres bits de información. 
Suponiendo que no haya ningún otro empleado cuyo nombre comience por 
las letras «Her...», las seis letras «Herman» también son redundantes para 
decir quién fue elegido. Tres letras hubieran sido suficientes, o tal vez una 
sola. 

Es importante recordar la diferencia entre la cantidad de información 
asociada a un estado de cosas y la forma en que la expresamos. La cantidad 
de información asociada a un estado de cosas es una reducción del número 
de posibilidades. Si se han reducido ocho posibilidades a una, como suce- 
día en nuestro ejemplo original, la cantidad de información asociada /(s) 
con este resultado es de tres bits. A la hora de describir esta reducción de 
posibilidades podemos elegir formas distintas, algunas de las cuales son 
eficaces y otras no. Con un código adecuado puedo describir lo que ocurrió 
(el hecho de que Herman fuese seleccionado) con tres símbolos binarios: 
101, pero otros códigos pueden requerir cuatro, veinte o mil símbolos para 
expresar los mismos tres bits de información. 

Llamaré a /(s) cantidad media de información generada por la fuente s. 
En la literatura técnica también se suele usar el término entropía de la 
fuente para referirse a esa cantidad. Por mi parte, también usaré esta ter- 
minología cuando lo crea conveniente. No obstante, hay que observar que 
cualquier situación puede ser considerada una fuente de información. Si 
en r hay un proceso que consiste en la reducción de posibilidades, sin tener 
en cuenta si el resultado de ese proceso depende de lo que pasó en s, en- 
tonces /(r) es la medida de la entropía de la fuente r. Si lo hechos que 
ocurren en s y r son interdependientes, entonces habrá también una inter- 
dependencia entre /(s) e [(r). No obstante, /(s) e [(r) siguen siendo canti- 
dades distintas (aunque interdependientes). 

La fórmula (1.1) proporciona una forma de calcular la cantidad de in- 
formación sólo en el caso de que las n posibilidades de s sean igualmente 
probables. En caso contrario, no podemos usar (1.1) para calcular la en- 
tropía de s. Supongamos, por ejemplo, que lanzamos al aire una moneda 
trucada del tal forma que la probabilidad de que salga cara en un determi- 
nado lanzamiento es de 0,9. El resultado de un lanzamiento de esa moneda 
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no representa un bit de información, como ocurría en el caso de una mo- 
neda no trucada. La probabilidad de que salga cara en una moneda no tru- 
cada es la misma que la de que salga cruz (= 0,5). Por tanto, aplicando la 
fórmula (1.1), tenemos que el resultado de un lanzamiento de la moneda 
representa un bit de información, puesto que log 2 = 1. En cambio, con 
una moneda no trucada la cantidad de información es menor. Se puede ver 
intuitivamente por qué eso es así. Se puede predecir el resultado del lan- 
zamiento de la moneda trucada. Aunque nos equivoquemos alguna vez, la 
mayoría de las veces (el 90%) acertaremos al predecir que saldrá cara. Es 
como escuchar la predicción del tiempo en la estación del monzón (en la 
que la probabilidad de lluvia para cualquier día es de 0,9) y escucharla en 
la estación normal (cuando la probabilidad de lluvia es, pongamos por 
caso, de 0,5). En ambos casos, la predicción transmite cierta información 
(sea «lluvia» o «sol»), pero, no obstante, las predicciones durante el pe- 
ríodo del monzón serán, por término medio, menos informativas. Sea 
como fuere, todo el mundo esperará que llueva y la mayor parte de las 
veces tendrán razón sin la ayuda de la predicción oficial. Durante la esta- 
ción del monzón la predicción oficial elimina menos «incertidumbre» (por 
término medio) y, por tanto, contiene menos información. 

Si tenemos una serie de posibilidades s1, s, .... sn, que no son todas 
igualmente probables, y llamamos p(s1) a la probabilidad de que suceda si, 
entonces la cantidad de información generada por la ocurrencia de s; es: 


(1.2) [(s,) = log Vp(s¡) = log p(s1) (dado que log 1/x = log x) 


A esto se le llama a veces el valor de sorpresa de un determinado suceso? 
(si). En nuestro ejemplo de la moneda (probabilidad de que salga cara: 0,9), 
la cantidad de información asociada con el resultado de la cara es .15 bits 
(log 1/.9 =.15), y la información generada por el resultado de la cruz es de 
3,33 bits (log 1/0,1 = 3,33). 

Cuando la probabilidad de las distintas alternativas es la misma, como 
ocurría en nuestro ejemplo original, el valor de sorpresa de todos los casos 
es igual. Dado que la probabilidad de que fuera designado Herman era de 
0,125, la cantidad de información asociada con su designación era log 





3 Véase Fred Attneave, Applications of Information Theory to Psychology: A Summary of 
Basic Concepts, Methods and Results, Henry Holt £ Company, Nueva York, 1959, pág. 6. 
El ejemplo del lanzamiento de la moneda ha sido tomado de Attneave. 
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1/0,125 =10g 8 = 3. Por tanto, la fórmula (1.2) da el mismo resultado que 
(1.1) cuando las probabilidades de las distintas alternativas son iguales?. 

No obstante, la teoría de la comunicación no se ocupa directamente de 
la cantidad de información asociada con la ocurrencia de un evento o señal 
específica. Se ocupa de fuentes, más que de mensajes particulares. «Si 
mensajes distintos contienen distintas cantidades de información, tiene 
sentido hablar de la cantidad media de información por mensaje que pode- 
mos esperar de esa fuente —el promedio de los distintos mensajes que la 
fuente pueda producir?.» Por ejemplo, cuando lanzamos al aire una mo- 
neda trucada, a veces saldrá cara (lo que sólo originará 0,15 bits de infor- 
mación) y a veces cruz (generando entonces 3,32 bits de información). Si 
se trata de una moneda trucada, saldrá cara muchas más veces. Por tanto, 
si estamos interesados en los lanzamientos de la moneda como fuente de 
información, nos interesa la cantidad media de información que puedan 
proporcionar muchos lanzamientos de la moneda. Podemos esperar 3,32 
bits una de cada diez veces y 0,15 nueve de cada diez veces. Así, por tér- 
mino medio, obtendremos algo más de 0,15 bits, pero bastante menos de 
3,32 bits. La fórmula que sirve para calcular la cantidad media de infor- 
mación /(s) asociada a una determinada fuente (que puede producir distin- 
tos estados, cada uno con su propio valor de sorpresa) es: 


(1-3) I(s) = Xp(s1) * (51) 


Es decir, tomamos los valores de sorpresa de cada una de las posibili- 
dades individuales de esa fuente /(s) y los ponderamos según la probabili- 
dad de ocurrencia p(s¡). La suma de todos ellos es la cantidad media de 
información generada por esa fuente, la entropía de s. En el caso del lan- 
zamiento de la moneda, el valor de sorpresa de las caras era de 0,15, y la 





+ Cuando la probabilidad de todas las posibilidades alternativas es la misma, la fórmula 
(1.1) nos proporciona tanto el valor de sorpresa asociado con la concurrencia de cada suceso 
individual como la cantidad medida de información que se genera en la fuente (la entropía), 
ya que todos los valores de sorpresa son iguales. Cuando todo el mundo es igual de alto, 
entonces la altura media es igual que la altura de cada uno de los individuos. En adelante 
usaré el símbolo /(s) para referirme a la cantidad media de información asociada con un de- 
terminado proceso; cuando me refiera a la información asociada a la concurrencia de algún 
suceso individual, usaré subíndices, como en la fórmula (1.2), por ejemplo, /(s2). 


5 George A. Miller, «What Is Information Measurement?», The American Psychologist, 
vol. 8, enero 1953, pág. 2. 
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probabilidad de que saliera cara era de 0,9. El valor de sorpresa de las cru- 
ces era de 3,32, y la probabilidad de que saliera cruz era de 0,1. Por tanto, 
de acuerdo con la fórmula (1.3), calculamos la cantidad media de informa- 
ción generada por los lanzamientos de la moneda del modo siguiente: 


I(s)  =p(s1) * I(52) + p(s2) * 152) 
= 0,9 (0,15) + 0,1 (3,32) 
= 0,467 bits 


En la mayoría de las aplicaciones de la teoría de la información la fór- 
mula importante es la (1.3). Como observa Bar-Hillel, los ingenieros de 
telecomunicaciones no usan para nada el valor de sorpresa de un estado de 
cosas, sino que emplean la fórmula del valor de sorpresa (1.2) para calcular 
la cantidad media de información generada por una fuente.? Este ocuparse 
únicamente de cantidades medias es perfectamente comprensible. Lo que 
el ingeniero quiere es un concepto que caracterice toda la naturaleza esta- 
dística de la fuente, no se ocupa de mensajes concretos. Un sistema de 
comunicación debe afrontar el problema de tratar cualquier mensaje que 
pueda producir la fuente. «Si no es posible o factible diseñar un sistema 
capaz de controlarlo todo perfectamente, hay que diseñarlo para que pueda 
desempeñar las tareas que es más probable que deba hacer. [...] Este tipo 
de consideraciones nos lleva inmediatamente a la necesidad de caracterizar 
la naturaleza estadística del conjunto de mensajes que un determinado tipo 
de fuente puede producir y de hecho produce”.» Es precisamente eso lo 
que hace el concepto de entropía, promedio de información, tal como se 
usa en la teoría de la comunicación. 

El lector recordará que al lanzar al aire una moneda no trucada (en que 
la probabilidad de que salga cara es igual a la de que salga cruz, es decir, 
0,5), el valor de sorpresa, tanto del resultado cara como del resultado cruz, 
era un bit. Como la probabilidad de que saliera una u otra era igual, la 
cantidad media de información asociada al proceso de lanzar al aire una 
moneda no trucada era: 





$ Yehoshua Bar-Hillel, Language and Information, Reading, Mass., 1964, pág. 295. 


7 Warren Waver, «Recent Contributions to the Mathematical Theory of Communication», 
que aparece como el ensayo introductorio en The Mathematical Theory of Communication, 
de Shannon y Weaver, Univer- sity of Illinois Press, Urbana, 111, 1949, pág. 14. 
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Is) =05(1)+0,5 (1) 
= 1 bit 


Esto significa que, por término medio, se genera menos información 
lanzando al aire una moneda trucada que lanzando una moneda no trucada. 
Ello se debe a que en el caso de la moneda trucada, el tipo de evento que 
genera menos información sucede más a menudo, y, de este modo, queda 
reducido el promedio. 

Aunque, generalmente hablando, el mayor promedio de información 
se obtiene cuando las posibilidades son igualmente posibles, los mayores 
valores de sorpresa se obtienen cuando las posibilidades no son igualmente 
probables. A pesar de que podemos obtener más información por término 
medio con una moneda no trucada, cada uno de los lanzamientos de la 
moneda trucada puede contribuir a la media con 3,3 bits de información 
(cuando sale cruz), cantidad muy superior a aquella con la que pueden 
contribuir los lanzamientos de la moneda no trucada (un bit). 

A medida que p(s¡) se aproxima a 1, la cantidad de información aso- 
ciada con la ocurrencia de s¡ tiende a O. En el caso límite en que la proba- 
bilidad de una condición o estado de cosas es la unidad [p(s1) = 1], la ocu- 
rrencia de s, no genera ni tiene asociada ninguna información. Eso no es 
más que otra forma de decir que no se genera información por la ocurren- 
cia de sucesos para los cuales no existen posibilidades alternativas (la pro- 
babilidad de todas las alternativas = 0). Si suponemos (de acuerdo con la 
teoría de la relatividad) que ninguna señal puede ir a una velocidad supe- 
rior a la de la luz, una señal que vaya a una velocidad menor que (o igual 
a) la velocidad de la luz no genera información. Y si (como piensan algu- 
nos filósofos) los individuos poseen esencialmente algunas de sus propie- 
dades, entonces el hecho de que esos individuos posean esas propiedades 
no genera ninguna información. Si el agua es necesariamente H20, su ser 
HO no genera ninguna información. Y, aunque seguramente el hecho de 
que un objeto sea un cubo sí genera información (podría haber tenido otra 
forma), el hecho de que este cubo tenga seis caras no implica ninguna in- 
formación adicional asociada a él (dado que un cubo no puede tener más 
que seis caras). 
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Estos casos límite no ofrecen un interés meramente teórico, ocioso. Su 
existencia tiene considerable importancia para las aplicaciones epistemo- 
lógicas de la teoría de la información, y volveremos sobre ellos en capítu- 
los posteriores. 


Cantidad de información transmitida 


Hasta aquí hemos hablado de la cantidad de información asociada a un 
determinado estado de cosas y la cantidad media de información generada 
por una fuente. En nuestro ejemplo la fuente en cuestión era el proceso 
mediante el cual Herman fue designado. Esta fuente generará, por término 
medio, tres bits de información. Además, cada uno de los resultados de ese 
proceso (por ejemplo, la selección de Herman) tenía un valor de sorpresa 
de tres bits. Esa es la cantidad de información que aportan a la media. /(s) 
es la cantidad media de información asociada con s, el proceso desarro- 
llado en la oficina donde estaban reunidos los empleados. /(s7) es la canti- 
dad de información asociada con un resultado particular (el séptimo) de 
ese proceso: la cantidad de información asociada con la selección de Her- 
man en ese día y en esa oficina. 

Pensemos ahora en lo que ocurre en el despacho del jefe poco después 
de que se haya designado a Herman e independientemente de lo que suce- 
dió antes en s. Sea r la situación general en el despacho del jefe y sean r, 
las varias posibles ejemplificaciones de r. El jefe recibe una nota en la que 
está escrito el nombre «Herman» (o los símbolos «101»), Dejando, por el 
momento, al margen cualquier posible complicación, eran al principio 
ocho los mensajes que el jefe podía haber recibido. La nota podía contener 
cualquiera de los ocho nombres (o cualquiera de las ocho posibles tríadas 
de ceros y unos). Cuando llega la nota con el nombre «Herman» (llamemos 
r aesa posibilidad), la «incertidumbre» desaparece. Las posibilidades han 
quedado reducidas a una. Suponiendo que los ocho mensajes son igual- 
mente probables, podemos usar la fórmula (1.1) para calcular la cantidad 
media de información asociada con el hecho de que el jefe recibiera esa 
nota: [(r) = tres bits. La cantidad de información asociada con el mensaje 
que se recibió (y que contenía el nombre «Herman») es también de tres 
bits. Es decir, 1(r7) = 3. El valor de sorpresa del mensaje que recibió el jefe 
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(77) es el mismo que el de cualquiera de los otros mensajes que podía haber 
recibido. Por tanto, para cualquier valor i, K(r) = K(r;). 

Si esta descripción de la información asociada con los acontecimientos 
del despacho del jefe parece una repetición trivial de algo que ya se ha 
descrito antes, el lector debiera recordar que estamos hablando de dos si- 
tuaciones completamente distintas. s7 se refiere a un estado de cosas que 
ocurre en la oficina en que se han reunido los empleados. Se refiere a la 
designación de Herman. r,, por otra parte, se refiere a la aparición del 
nombre «Herman» en el mensaje que ha sido entregado al jefe. Tanto I(s7) 
como /(r7) son iguales a tres bits, pero el hecho de que sean iguales no es 
una verdad trivial, porque s7 4r7. De forma parecida, aunque /(s) = Ir), su 
igualdad numérica es un hecho contingente, puesto que la fuente (s) y el 
receptor (r) son situaciones físicamente distintas. 

El hecho de que /(r) = [(s) no es, por supuesto, accidental. La reducción 
del número de posibilidades en r está relacionada con la reducción de po- 
sibilidades en s mediante la decisión de los empleados de que su nota al 
jefe fuera una fiel exposición de lo que ocurrió en su proceso de selección. 
Esto podría no haber sido así. Imaginemos que todos los empleados estu- 
vieran preocupados por la delicada salud de Shirley y que hubieran acor- 
dado poner el nombre de Herman en la nota si por casualidad resultara 
elegida Shirley en el proceso de selección. En ese caso, /(s) seguiría siendo 
igual a tres bits, dado que cualquiera de los ocho empleados, Shirley in- 
cluida, podría ser seleccionado mediante el sistema de lanzar una moneda 
al aire, y todos tienen la misma posibilidad de ser elegidos. No obstante, 
dada su intención de proteger a Shirley, sólo habría, en realidad, siete nom- 
bres que pudieran aparecer en la nota que enviaron al jefe. Por tanto (sin 
que el jefe lo supiera), la reducción del número de posibilidades en r sería 
en realidad una reducción de siete a uno. La aparición del nombre «Her- 
man» en la nota tiene un valor de sorpresa de menos de tres bits, puesto 
que es el doble de probable que la aparición de cualquier otro nombre. En 
ese caso, (r7) =10g 1/p(r7) = log 1/0,25 = 4 = dos bits. El valor de sorpresa 
de la aparición de cualquier otro nombre en la nota sigue siendo de tres 
bits. Por tanto, la cantidad media de información asociada con la aparición 
de un nombre en la nota (en estas circunstancias) tiene que calcularse de 
acuerdo con (1.3) 


e 
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Ir) =2p(5) *I(r,) 
= 0,125 (3) + 0,125 (3) + 0,125 (3) + 0,125 (3) + 0,125 
(3)+ 0,125 (3) + 0,25 (2) 
= 2,75 bits 


Cualquier situación podría ser considerada, aisladamente, como un ge- 
nerador de información. Cuando sucede, podemos considerarla como una 
reducción de lo que podría haber ocurrido a lo que de hecho sucedió, y 
obtener una medida adecuada de la cantidad de información asociada con 
el resultado. Así es como estamos tratando ahora lo que sucede en el des- 
pacho del jefe. Llega una hoja de papel que lleva escrito el nombre «Her- 
man». En nuestro primer ejemplo, este papel podía llevar escrito cual- 
quiera de los ocho nombres. Por tanto, /(r) = tres bits de información. Pero 
también podemos considerar lo que sucede en el despacho del director, la 
situación que designamos con r, no como un generador de información, 
sino como un receptor de información y, más específicamente, como un 
receptor de información sobre s. Estamos hablando de la misma situación 
r, pero nos estamos haciendo otra pregunta sobre ella. ¿Cuánta de la infor- 
mación de /(r) es información sobre s? De la información generada en (s), 
I(s), ¿cuánta llega a r? 

Ahora estamos preguntando por el valor informacional de la situación 
r, pero no por /(r). Preguntamos en qué medida /(r) es información reci- 
bida de s o acerca de s. Usaré el símbolo /s(r) para designar esta nueva 
cantidad. La r entre paréntesis indica que estamos preguntando por la can- 
tidad de información asociada con r, pero el subíndice s sirve para indicar 
que estamos preguntando por la parte de /(r) que es información recibida 
de s. 

Bastarán unos cuantos ejemplos para aclarar esta distinción. En nuestro 
ejemplo inicial /(r7) era tres bits. Esa es la cantidad de información aso- 
ciada a la aparición del nombre «Herman» en la nota. Pero, en cierto sen- 
tido, estos tres bits de información tuvieron su origen en la oficina en que 
estaban reunidos los empleados. Tuvieron su origen allí en el sentido de 
que la selección de Herman por parte de los empleados determinó el nom- 
bre que aparecería en la nota. La reducción de posibilidades que tuvo lugar 
en s, reducción por la cual /(s7) = tres bits, reduce al mismo tiempo las 
posibilidades de r de ocho a una, haciendo así que /(r7) = tres bits. Dadas 
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las circunstancias?, los tres bits de información asociada a la aparición de 
«Herman» en la nota (77) no suponen ninguna reducción adicional de po- 
sibilidades respecto a la información asociada con la selección de Herman 
(s7). En este sentido, pues, /(r7) no es más que antigua información, infor- 
mación sobre lo que sucedió en s. Por tanto, /:(r)= [(s) = tres bits. 

Cambiemos ligeramente el ejemplo. Los empleados escriben el nom- 
bre «Herman» en la nota y la entregan a un mensajero inexperto y negli- 
gente. De camino hacia el despacho del jefe, el mensajero pierde la nota. 
Sabe que el mensaje contenía el nombre de uno de los empleados, pero no 
recuerda cuál era; en lugar de ir a buscar otra nota, escribe el nombre «Her- 
man» en una hoja de papel y la entrega. Todo sale igual que en el primer 
caso; la tarea es asignada a Herman y nadie sabe de la negligencia e irres- 
ponsabilidad del mensajero. No obstante, las diferencias entre las dos si- 
tuaciones por lo que respecta a la información transmitida de s a r son 
significativas. En este segundo caso /(s) sigue siendo tres bits, [(r) también 
es tres bits, puesto que (es de suponer que) el mensajero eligió al azar el 
nombre de «Herman». Podría haber escrito (y tenía las mismas posibilida- 
des de haber escrito) cualquiera de los ocho nombres. Sin embargo, /x(r) = 
0. No se transmitió ninguna información de sa r. La reducción de posibi- 
lidades en r, la reducción por la cual /(r) = tres bits, es totalmente indepen- 
diente de la reducción que tuvo lugar en s y por la cual /(s) = tres bits. 
Dicho de otro modo: no hay en r ninguna información sobre s + [(r) es una 
medida de la información que hay en la situación r sobre la situación s. 
Dado que en r hay tres bits de información, pero ninguno de esos tres bits 
proviene de s, /(r) = tres bits, pero /(r) = 0. Hablando en términos técnicos, 
diremos que la información que hay en res ruido (ruido es una medida de 
la información, o reducción de posibilidades, de r que es independiente de 
lo que sucedió en sy”. 





3 En el caso originario estamos suponiendo un conjunto de circunstancias, óptimas, por lo 
menos, desde el punto de vista de la teoría de la comunicación. Por ejemplo, los empleados 
no tienen ninguna intención de mentir (el nombre que escriben en la nota siempre indica la 
persona a quien se seleccionó), el mensajero es totalmente fiable, etc. Para mayor informa- 
ción sobre las circunstancias que definen el canal de la comunicación, véase el capítulo 5. 


2 El ruido es siempre relativo a alguna fuente en concreto. Así, por ejemplo, el «chin» de 
un aparato de radio es relativo a los eventos acústicos que suceden en el estudio radiofónico 
(dado que el origen de este sonido es independiente de lo que dice el locutor), pero no es 
ruido respecto a lo que está ocurriendo en el baño del vecino (lleva información sobre si está 
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Ís(r) es una medida de cantidad de dependencia de r respecto a s. En r 
tiene lugar una reducción de las posibilidades, e /,(r) es la medida del grado 
en que esa reducción debe ser explicada por los acontecimientos que tu- 
vieron lugar en s, es decir, de la medida en que la reducción acaecida en r 
(la información de r) es información antigua (información generada en s). 

La figura 1-1 ' representa las relaciones existentes entre las tres canti- 
dades de las que hemos hablado hasta ahora: 


X(s) X(r) 


(Fig. 1.1) os 

Í[s(r) es la parte del círculo /(s) que está incluida en el círculo /(r). En 
nuestro ejemplo original, todo I(s) estaba incluido en /(r), el mensaje para 
el jefe contenía toda la información que se había generado en s respecto al 
resultado del proceso de selección. Además, el mensaje no contenía nin- 
guna información adicional que fuera relevante para el ejemplo. Por tanto, 
[(s) = I(r) = tres bits. Esta situación podría representarse como en la figura 
1-2 





o no usando su nueva máquina de afeitar eléctrica). En general, no me preocuparé de hacer 
explícita esta observación. Dada una fuente, cualquier referencia al ruido debe entenderse 
como ruido relativo a esa fuente. 


10 Los diagramas son adaptaciones del que Miller da en «What Is Information Measure- 
ment?». Véanse también los diagramas de Attneave, que son tres variaciones, en las pág. 56 
y 58 de Applications of Information Theory to Psychology. 
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I(s) X(r) 


Y 
(Fig. 1.2) y > 


Las áreas sombreadas no contienen información. Toda la información 
del círculo /(s) está contenida en el círculo /(r). Hay una comunicación 
perfecta entre s y r. Nuestro ejemplo modificado, la situación en que el 
mensajero pierde la nota enviada al jefe y redacta otra, se representaría 
como en la figura 1-3 


X[(s) I(r) 


Y, 


¿ 


(FIG. 1.3) 


No hay flujo de información entre s y r. 1(r), la información asociada 
con 7, no contiene ninguna parte de la información generada en s, /(s). 

Las figuras 1-2 y 1-3 representan los casos extremos, a saber, la comu- 
nicación perfecta y la comunicación nula. Por supuesto, hay grados inter- 
medios, de los cuales también tenemos un ejemplo. Cuando los empleados 
no quisieron poner el nombre de Shirley en su nota al jefe, a pesar de que 
había resultado seleccionada en el proceso de selección, /(s) era tres bits, 
pero /(r) e [(r) eran menos de tres bits. La representación correcta de ese 
caso es la de la figura 1-4 


0 
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X(s) 1(r) 


Y 


En esta situación se ha perdido parte de la información generada en s, 
no llega toda a r. No se comunica la información de que Herman ha sido 
designado por el proceso de selección de los empleados; la nota con el 
nombre «Herman» sólo lleva la información de que o bien Herman o bien 
Shirley ha sido seleccionado!'. Dado que se pierde esta información, una 
parte del círculo /(s) contiene información (no está sombreada) y no está 
incluida en el círculo /(r). Debe entenderse que estos diagramas represen- 
tan la situación en cuanto a lo que al valor medio de estas cantidades se 
refiere. 

Espero que estos diagramas proporcionen al lector una imagen intui- 
tiva aproximada de las relaciones entre /(s), I(s) e [(r). Hasta ahora no he 
hablado de cómo hay que medir /,(r). Por lo que se ve en estos diagramas, 
está claro que /s(r) no puede ser mayor que l(s) o /(r). La información 
recibida en r desde s no puede ser mayor que la cantidad total de informa- 





11 Es importante para la correcta comprensión de este ejemplo que no se considere la nota 
enviada al jefe (y que contiene el nombre de algún empleado) como un tipo de acto perfor- 
mativo que constituye la elección de los empleados de la persona cuyo nombre aparece en la 
nota, sino que debe verse la nota como algo que lleva información sobre una elección previa 
e independiente: a saber, la de quién perdió en el juego del lanzamiento al aire de la moneda. 
En cuanto acto performativo, el mensaje enviado al jefe no es ni exacto ni inexacto, sino que 
la aparición del nombre «Herman» en la nota constituye la selección de Herman por parte de 
los empleados. No obstante, si se considera la nota como la comunicación de quién perdió en 
el juego de cara o cruz, entonces el mensaje puede ser correcto o incorrecto, dependiendo de 
si el nombre que en ella aparece corresponde no a la persona que resultó seleccionada a cara 
o cruz. La situación debe entenderse de esta última forma, ya que sólo en ese caso la nota 
contiene información acerca de algún estado de cosas independiente. 
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ción generada en s, ni tampoco mayor que la cantidad de información pre- 
sente en r. No obstante, aparte de esa limitación, no se ha dicho nada sobre 
el modo en que se calcula /,(r). La teoría de la comunicación nos propor- 
ciona varias fórmulas para calcular esta cantidad. Como no me interesa la 
aplicación cuantitativa precisa de esas fórmulas —sino sólo los principios 
subyacentes que ilustran—, las voy a introducir mediante otras dos fórmu- 
las que pueden resultar más sugerentes para el lector!?. La información 
transmitida desde s a res la cantidad total de información disponible en r, 
[(r), menos una cantidad que se llama ruido (esa porción del círculo /(r) 
que hemos llamado N en la figura 1-1) 


(1.4) Ir) = K(r) — ruido 


Otra forma de calcular la cantidad, que un examen de la figura 1-1 su- 
glere inmediatamente, es la siguiente: 


(1.5) Ir) = I(s) —equivocidad 


donde la equivocidad es la parte del círculo /(s) que hemos llamado E. La 
equivocidad es la información generada en s la cual no se transmite a r. La 
cuestión es la información utilizable que está en r y no se ha recibido de s. 
Se podría decir que la información generada en s está dividida en dos par- 
tes: 1) la parte que se transmite a r[/,(r)], y 2) la parte que no se transmite 
(equivocidad). La información que hay en r se podría dividir de forma pa- 
recida en dos partes: 1) la que representa la información recibida de s, [x(r), 
y 2) la parte restante, cuya fuente (si es que tiene otra fuente) no es s 
(ruido). Si pensamos en todo lo que sucede en la oficina en que se han 
reunido los empleados, no sólo en los resultados de su selección de un 
candidato, hay gran cantidad de información generada en esta oficina (por 
ejemplo, dónde está Herman cuando se efectúa el primer lanzamiento de 
la moneda) que no se transmite al despacho del jefe. Esta información su- 
pone una equivocidad, y la cantidad total de esta primera generada en s, 
1(s), es igual a esta equivocidad más la información transmitida a r, /s(r); 
de ahí la fórmula (1.5). De forma parecida, hay cierta información asociada 





12 En general, sigo el desarrollo que Wendell R. Garner hizo de estas ideas (aunque uso una 
notación distinta); véase su Uncertainty and Structure as Psychological Concepts, Nueva 
York, 1962. 
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a la nota al jefe que no proviene del resultado del proceso de selección de 
los empleados (o cualquier otro acontecimiento que suceda en s). Por 
ejemplo, el mensaje fue colocado en el centro del escritorio del jefe; podría 
haber sido colocado en cualquier otra posición sobre el escritorio. En el 
sentido técnico del término, en la teoría de la información, esto es infor- 
mación, ya que supone la reducción de posibilidades. No obstante, no es 
información recibida de s, sino ruido. El total de información que hay en 
el despacho del jefe, /(r), es la suma de ese ruido y la información recibida 
de s, [s(r), lo cual no es más que la repetición de lo que dice la fórmula 
(1.4). 

No hay apenas (si es que hay alguna) comunicación sin ruidos. En este 
sentido, la figura 1-2 es una idealización, y también lo es nuestra descrip- 
ción del ejemplo original. Decíamos que cuando llegó al despacho del jefe 
la nota con el nombre «Herman», ésta constituía una reducción de ocho 
posibilidades a una. Cualquiera de los ocho nombres podía haber apare- 
cido en la nota. Por tanto, /(r) era igual a tres bits. Pero está claro que, 
aunque sólo sean ocho los nombres que podían aparecer en la nota, cada 
nombre podía aparecer de varias maneras. Podía estar impreso o escrito a 
mano; podía usarse tinta de distintos colores; el nombre podía estar escrito 
en el centro o en las esquinas del papel. Si incluimos todas esas posibili- 
dades, la forma en que de hecho se escribió la nota supone la reducción de 
un número de posibilidades muchísimo mayor que ocho. /(r) es mucho 
mayor que tres bits. No obstante, desde el punto de vista de la comunica- 
ción sobre quién fue seleccionado, toda esta información adicional en r es 
ruido. Por muy grande que sea /(r), [s(r) sigue siendo tres bits. Los demás 
parámetros nos dan una señal con ruido, pero el mensaje se transmite a 
pesar de ello. 

Un aumento del ruido (en el sentido técnico de información que hay en 
el receptor y que no depende de la información generada en la fuente) no 
implica necesariamente una reducción de la cantidad de información trans- 
mitida. Como muestra la figura 1-1, el círculo /(r) puede crecer mucho 
aumentando N (el ruido), el área que está fuera del círculo /(s), sin reducir 
Í[s(r). En situaciones reales y concretas, un aumento del ruido (el tipo de 
ruido corriente «pum-chin-cras») no sólo aumentará N (el ruido en el sen- 
tido técnico), sino que también quedará oculta una parte de la señal reci- 
bida, y así se reducirá [(r) mediante el aumento de la equivocidad. En tales 
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casos N aumenta por un movimiento del círculo /(r) hacia la derecha, dis- 
minuyendo así el área en que se solapa con círculo /(s). El ruido aumenta 
a expensas de /s(r). No obstante, mientras no aumente la equivocidad [su- 
poniendo que /(s) permanezca constante], la información transmitida sigue 
siendo la misma independientemente de cuán grande sea el ruido. Por 
ejemplo, el informe radiofónico: 


a) El domingo lloverá (pum, chin, cras, ssst), tiene una buena cantidad 
de ruido, pero el ruido no interfiere ninguna parte del mensaje que se está 
transmitiendo desde el estudio. Al calcular /(r), tendríamos que incluir es- 
tos «eras» y «sssts» (representan reducciones de posibilidades en r), pero, 
puesto que no aumentan el grado de equivocidad, la cantidad de informa- 
ción transmitida /s(r) sigue siendo la misma que sin las interferencias. 
Comparemos a) con b): 


b) El pum-nes (chin, cras, ssst) va a llover. Aquí tenemos la misma 
cantidad de ruido, pero la cantidad de información transmitida ha quedado 
reducida porque el ruido incrementa la equivocidad. La equivocidad au- 
menta porque parte de la señal del estudio de radio permanece oculta, lo 
que da lugar a un mensaje ambiguo (equívoco). Dados los acontecimientos 
de r, la predicción podría haber sido de lluvia para el lunes o para el vier- 
nes. Se perdió la información del hecho que el locutor dijo «viernes» y la 
cantidad de información perdida es lo que se mide mediante la equivoci- 
dad. Si el ruido aumenta la cantidad de información que se pierde, dismi- 
nuye la cantidad de información transmitida; pero si no afecta a la equivo- 
cidad, entonces /,(r) sigue siendo la misma!”. 





13 Obsérvese que mi exposición del «ruido» y la «equivocidad» no es ortodoxa desde un 
punto de vista técnico. En el marco de la teoría de la comunicación estas cantidades son 
siempre numéricamente iguales, porque l(s) e I(r) son iguales. Por tanto, cualquier aumento 
del ruido supone automáticamente un aumento de la equivocidad, y un canal sin ruido es 
también un canal sin equivocidad. 

La equivalencia del ruido y la equivocidad resulta de haber escogido el conjunto de posibi- 
lidades de la fuente y el receptor de tal manera que /(s) = I(r). Lo que se ha hecho en el texto 
es imaginar cambios en el conjunto del output [el conjunto de posibilidades que definen 1(r)] 
sin los correspondientes cambios en el conjunto del input [las posibilidades que definen /(s)], 
y viceversa. Si esto se puede hacer, entonces es que no existe una necesaria equivalencia 
entre ruido y equivocidad. 
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Hasta ahora nos hemos basado sobre todo en un ejemplo al que algunos 
podrían poner objeciones. Lo encontrarán objetable, o por lo menos sos- 
pechoso, porque implica el uso del lenguaje. Se podría pensar que el aná- 
lisis informacional (en la medida en que aquí se ha mostrado) obtiene una 
espaciosa plausibilidad de su aplicación a una situación en la que hay algo 
así como información real que se comunica mediante signos lingiiísticos 
(por ejemplo, la palabra «Herman»), Para mostrar que los nombres, signos 
lingiísticamente significantes, no desempeñan ningún papel esencial en 
este ejemplo, o en su descripción en términos de teoría de la información, 
consideremos una situación análoga. Hay ocho muchachos traviesos y ha 
desaparecido una galleta. ¿Quién la ha cogido? Observándolos se descubre 
que hay migajas en los labios de Júnior. Desde el punto de vista de la teoría 
de la información, este caso es idéntico al anterior. Cualquiera de los ocho 
muchachos puede haber cogido la galleta, y todos tienen las mismas pro- 
babilidades de haberla cogido. Por tanto, el hecho de que Júnior se haya 
comido la galleta supone la reducción de ocho posibilidades a una. /(s) = 
tres bits. Con algunas suposiciones habituales, podemos decir que las mi- 
gajas en los labios de Júnior llevan tres bits de información sobre quién se 
comió la galleta; es decir, /,(r) = tres bits. Por supuesto que la cantidad de 
información que r lleva acerca de s puede ser menor de tres bits, pero ocu- 
rre lo mismo en nuestro ejemplo de los empleados y el jefe. 

En este ejemplo, la situación de las migajas (en los labios de Júnior) 
tiene el mismo papel informacional que el que tenía la leyenda «Herman» 
en el ejemplo anterior. No se necesita ningún supuesto acerca del signifi- 
cado o la referencia de este nombre: no más de lo que necesitamos suponer 
sobre el significado o la referencia de las migajas que están en los labios 
de Júnior. Desde el punto de vista de la teoría de la comunicación, todo lo 
que hay que suponer (para que se transmita la información) es que la apa- 
rición del nombre «Herman» en la nota que se envía al jefe depende de 
alguna manera del resultado del proceso de selección utilizado por los em- 
pleados. Si estas marcas físicas en el papel (sea cual sea su significado 
convencional) dependen de la selección de Herman del mismo modo que 
las migajas en los labios de Júnior dependen de que éste se haya comido 
la galleta, entonces estas marcas en el papel proporcionan información so- 
bre los resultados del proceso de selección del mismo modo que las miga- 
jas la proporcionan acerca de quién se comió la galleta. Esto es, por lo 
menos, lo que dice la teoría de la comunicación. Esta teoría se aplica a la 
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transmisión de información por medios lingúísticos del mismo modo en 
que se aplica a la transmisión de información por cualesquiera otros me- 
dios. Esta generalidad es uno de sus atractivos. 

La fórmula (1.4) nos dice que la cantidad de información transmitida 
entre s y res igual a la cantidad de información presente en r, [(r), menos 
el ruido. La fórmula (1.5) nos dice que la cantidad de información trans- 
mitida se puede calcular restando la equivocidad a 1(s). Ya que podemos 
calcular /(r) y I(s) [mediante las fórmulas (1.1), (1.2) y (1.3)], todo lo que 
necesitamos para obtener /s(r) es alguna forma de medir el ruido y la equi- 
vocidad. 

Una vez más, lo que se calcula normalmente es el valor medio de estas 
magnitudes, puesto que, como hemos visto, ésta es la magnitud que más 
interesa en las aplicaciones a la ingeniería. No obstante, nosotros vamos a 
desarrollar las fórmulas para el promedio de ruido y la equivocidad media 
en términos de la contribución a la media de un determinado evento, dado 
que ésta es la magnitud que tendrá mayor importancia en nuestro análisis 
posterior. 

Las fórmulas para calcular el ruido y la equivocidad pueden parecer 
bastante complicadas, pero la idea básica es en realidad muy sencilla. E y 
TV son medidas del grado de independencia entre lo que ocurre en la 
fuente y en el receptor. Si estos sucesos son totalmente independientes (el 
orden en que están mezcladas las cartas de una baraja no tiene nada que 
ver con el que tendrán las de otra que ha sido barajada independiente- 
mente), entonces, E y N serán máximos. Por tanto, [(r) será mínima. Si, 
por otra parte, lo que ocurre en r no es independiente de lo que sucede es 
s (el sonido del timbre de la puerta no es independiente de lo que pasa en 
el pulsador), entonces E y N quedarán proporcionalmente reducidos. Si el 
grado de independencia es O (dependencia máxima), entonces E y N serán 
O y la cantidad de información transmitida /,(r) será óptima: 1.(r) = I(s). 
Las fórmulas siguientes no son más que formas de calcular el grado de 
independencia entre lo que ocurre (y puede ocurrir) en s y r. 

Usando los mismos números que en nuestro ejemplo original, supon- 
gamos que en s hay ocho posibilidades y que sucede la séptima (s7) (Her- 
man resulta elegido). P(+¡/s7) para la probabilidad condicional de r; dado 
s7. Por ejemplo, P(r;¡/s7) será la probabilidad condicional de que aparezca 
el nombre de Herman en la nota, dada la selección de Herman. Si rg repre- 
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senta la aparición del nombre de Shirley en la nota P(re/s7) es la probabi- 
lidad condicional de que aparezca el nombre de Shirley en la nota, dada la 
selección de Herman. Calculamos la contribución de s7 al promedio de 
ruido mediante la siguiente fórmula!*: 


(1.6) N(s7) = —2P(ri/s7) * log P(ri/s7) 


Según los términos de nuestro ejemplo original, había ocho posibilida- 
des para r,, es decir, podían aparecer ocho nombres distintos en la nota. 
Por tanto, cuando desarrollamos el sumatorio de la fórmula (1.6), obtene- 
mos ocho términos. 


N(s7) = -[ P(ri/s7) * log P(ri/s7) + ... + P(rs/s7) * log P(rg/s7)] 


Además, las cosas se concibieron originariamente de tal modo que la 
nota había de llevar ineludiblemente el nombre de la persona seleccionada 
por los empleados: es decir, la probabilidad condicional de rz dado s7 era 
1, y la probabilidad condicional de cualquier otro r, (r¡; por ejemplo) era 
0. Lo que ocurriera en r no era independiente de lo que sucediera en s. Esta 
falta de independencia se refleja en los términos de (1.6). Consideremos el 
primer término del desarrollo de N(sy): 


P(ri/s7) + log P(ri/s7) 


Dado que, como hemos visto, la probabilidad de r¡ (que aparezca el 
nombre de Donald en la nota), dado el hecho de que Herman fue seleccio- 
nado, es O, este término tiene que ser igual a O, ya que P(ri/s7) = 0. Lo 
mismo vale para cualquier otro término del desarrollo, excepto el séptimo: 


P(r71s7) + log P(r7/s7) 





14 Aparece un signo negativo al principio de la fórmula (1.6) porque el logaritmo de una 
probabilidad es generalmente negativo (dado que el logaritmo de una fracción menor que 1 
es negativo, y las probabilidades en cuestión suelen ser menores que 1). Como ln 1/x =-—In x, 
podríamos reescribir la fórmula sin el signo negativo tomando el logaritmo de la probabilidad 
recíproca (es decir, 1/P(r7/s;), pero eso no haría más que hacer todavía más complicada la 
notación. 
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La probabilidad condicional de que aparezca el nombre de Herman en 
la nota, dado el hecho de que Herman fue seleccionado, es 1. Por tanto, 
este término se reduce a: 


l - log 1 


y, dado que el logaritmo de 1 es 0, también es igual a O. Por tanto, la con- 
tribución de s7 al promedio de ruido es O. Si calculásemos la contribución 
de cualquier otro posible suceso de s (por ejemplo, se, la selección de Shir- 
ley), obtendríamos el mismo resultado. Ni lo que ocurrió en realidad (s7) 
ni cualquier otro suceso posible contribuyen en absoluto al promedio de 
ruido. Por tanto, el promedio de ruido será O. Por tanto, de acuerdo con 
(1.4), tenemos que la cantidad de información transmitida /,(r) es óptima. 

Para calcular el promedio de ruido, N, nos limitamos a sumar las con- 
tribuciones individuales y a ponderarlas según su probabilidad de ocurren- 
cia: 


(1.7 N =p(si) * N(si) + p(s2) + N(s2) + ... + p(ss) * N(sg) 


Como N(s;) = 0 para todos los ¡ de este ejemplo, N=0. 

La equivocidad E se calcula de forma análoga. Cogemos los varios 
eventos que pueden ocurrir en r, ri, r2, ..., rg, y calculamos su contribución 
individual a la equivocidad media: 


(1.8) E(r7) = —=P(si/r7) * log P(si/rz) 


Para obtener la equivocidad media E, sumamos las contribuciones in- 
dividuales y las ponderamos según sus respectivas probabilidades: 


(1.9) E= p(ryElr;) +... + p(rs)E(r3) 


Por supuesto, cada vez ocurrirá sólo uno de los sucesos r; (por ejemplo, 
va a aparecer el nombre de Herman en la nota). Este suceso llevará aso- 
ciado un cierto grado de equivocidad, una cantidad de equivocidad deter- 
minable mediante (1.8). La equivocidad asociada con este suceso en par- 
ticular puede ser mucho mayor o menor que la equivocidad media asociada 
al proceso considerado como un todo (la clase de equivocidad que obten- 
dríamos por término medio si repitiéramos el proceso una y otra vez). Re- 
cordemos, por ejemplo, el tipo de situación que describíamos en nuestro 
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ejemplo modificado, la situación en que los empleados estaban preocupa- 
dos por la salud de Shirley. Si salía Shirley o bien Herman, entonces apa- 
recía el nombre «Herman» en la nota que se enviaría al jefe. Si salía alguna 
otra persona, aparecería su nombre. Supongamos que Herman es seleccio- 
nado y aparece el nombre «Herman» en la nota al jefe. En ese caso, hay 
claramente cierto grado de equivocidad. Si calculamos la cantidad de equi- 
vocidad con la que este suceso en particular contribuye a la media de 
acuerdo con la fórmula (1.8), tenemos en el desarrollo de la fórmula dos 
términos que no son igual a 0: 


E(r7) = [P(só/r) * log P(so/r7) + P(s71r7) + log P(s7/r7) ] 


Si suponemos que la probabilidad condicional de que Herman haya 
sido seleccionado, dado que su nombre aparece en la nota, es 0,5 y que la 
probabilidad condicional de que Shirley haya sido seleccionada, dado que 
en la nota figura el nombre de Herman, es 0,5, entonces 


E(r7) = 0,5 log 0,5 + 0,5 log 0,5) = un bit 


Por lo tanto, cuando el nombre de Herman aparece en la nota, este su- 
ceso lleva asociada una equivocidad de un bit. Esta equivocidad surge del 
hecho de que este suceso de r no especifica unívocamente lo que sucedió 
en s. Todo lo que nos dice el nombre de Herman escrito en la nota (o nos 
diría si supiéramos lo suficiente sobre la situación en cuestión) es que o 
bien fue seleccionado Herman o bien Shirley. Lo que sucede en r, r7, re- 
duce las posibilidades de s de ocho a dos. Por tanto, la cantidad de infor- 
mación transmitida es de dos bits, y esta cantidad se obtiene restando la 
equivocidad a la cantidad de información asociada a la selección de Her- 
man, es decir, [(r7) = [(s7) —- E(r7) = 3 — 1 = dos bits. Pero la equivocidad 
media es mucho menor que un bit. Cuando aparece el nombre de Donald 
en la nota no hay equivocidad, como revelará el examen de la fórmula 
(1.8), y lo mismo vale para los seis nombres restantes. Por tanto, la equi- 
vocidad media (dada la probabilidad de que aparezca el nombre de Her- 
man en la nota = 0,25) es de 0,25 bits, 


E=0+0+0+0+0+0+ 0,25 (1) = 0,25 bits 
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Por tanto, la cantidad media de información transmitida /s(r) es de 2,75 
bits. Es importante distinguir la equivocidad asociada a un suceso en par- 
ticular de la equivocidad media, ya que cuando hablemos de lo que se 
puede saber nos ocuparemos de la cantidad de información transmitida por 
(y, por tanto, de la equivocidad asociada a) señales individuales, no de 
promedios. Por ejemplo, en esta situación tal vez el jefe pudiera saber que 
se seleccionó a Donald cuando recibe una nota con el nombre «Donald», 
pero no que se seleccionó a Herman (incluso si fue seleccionado) cuando 
recibe una nota con el nombre «Herman». Esto podría suceder porque una 
nota con el nombre «Donald» lleva más información acerca de quién fue 
seleccionado que una nota con el nombre «Herman». 


Causalidad e información 


Podría parecer que la transmisión de información, tal como se ha des- 
crito, es un proceso que depende de la interrelación causal entre fuente y 
receptor. Se pasa un mensaje de s a r iniciando una secuencia de aconteci- 
mientos en s que culmina en la correspondiente secuencia de r. En térmi- 
nos abstractos, el mensaje es llevado de s a r mediante un proceso causal 
que determina lo que ocurre en r en función de lo que ocurre en s. 

El flujo de la información puede depender, y evidentemente en la ma- 
yoría de los casos habituales depende, de procesos causales subyacentes. 
No obstante, hay que distinguir las relaciones causales y las relaciones in- 
formacionales existentes entre s y r. 

Consideremos la siguiente situación, muy simplificada (y ahora ya fa- 
miliar). Hay una variable en s que puede tomar cualquiera de cuatro valo- 
res distintos: 51, 52, 53, $4. También hay una variable en r que puede tomar 
cuatro valores distintos. Supongamos que, en una ocasión determinada, 
tiene lugar la secuencia de acontecimientos que se muestra en la figura 1- 
de 


Estación emisora Estación receptora 


(FIG. 1.5) e 0 
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La flecha continua entre s, y rz indica que existe entre ellas una cone- 
xlón causal. El hecho de que la variable r tome el valor rz indica que existe 
entre ellas una conexión causal. El hecho de que la variable s tome el valor 
s2 causa el hecho de que la variable r tome el valor rz. Esto es lo que con- 
figura el argumento causal. No obstante, ¿cuál es en términos de la teoría 
de la información? 

Con los datos proporcionados hasta ahora se puede decir muy poco 
sobre la cantidad de información transmitida de s a r. Suponiendo que to- 
dos los valores de la variable son igualmente probables, la información 
generada en s por la ocurrencia de s» es de dos bits. 

Pero, ¿en qué medida llega a r esa información? ¿En qué medida r» 
contiene la información generada por s2? Todavía no podemos dar una res- 
puesta a esas preguntas. No podemos decir cuánta información se ha trans- 
mitido porque en este desarrollo argumental causal se ha omitido un hecho 
decisivo, a saber: ¿hay algún otro valor de la variable s (además de s2) que 
hubiera producido r,? Todavía no tenemos los hechos esenciales para de- 
terminar la equivocidad de la señal. 

Para ilustrar este punto vamos a añadir a nuestra descripción de la si- 
tuación (sucede s, y causa r2) una descripción de la relación existente entre 
los demás valores posibles de las variables. Representaremos mediante una 
línea discontinua una conexión causal que no existe realmente (porque los 
eventos que relaciona no llegan a suceder), pero que existiría si se diera el 
adecuado valor de s. 


Estación emisora Estación receptora 
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(FIG. 1.6) 


Supongamos que el sistema de conexiones causales es el representado 
en la figura 1-6. En esta situación hipotética, s2 no sólo causa r», sino que 


—4p— 
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es el único valor de s que causa rz. Consultando la fórmula de la equivoci- 
dad (1.8), tenemos que la equivocidad de la señal rz es cero. Por tanto, 
[s(r2) = [(s2); la cantidad de información que contiene la señal acerca de la 
fuente es igual a la cantidad de información generada en la fuente por la 
ocurrencia de s». 

Comparemos este posible estado de cosas con la figura 1-7. Como an- 
tes, la flecha continua representa la situación real: sucede s2 y causa r>. Las 
flechas discontinuas señalan conexiones causales que no llegan a produ- 
cirse (porque no se da la causa), pero que existirían si existiera el antece- 
dente causal adecuado. 


Estación emisora Estación receptora 
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(FIG. 1.7) 


La flecha discontinua que sale de sa tiene tres ramificaciones que indi- 
can que el resultado de la ocurrencia de s4 no es siempre el mismo. Algunas 
veces (34%) causa r¡, algunas veces r3 (33%) y otras ra (33%). Si se pre- 
fiere no decir que el mismo tipo de suceso tiene efectos distintos en idén- 
ticas circunstancias, se puede decir que la flecha que sale de s4 y se rami- 
fica representa algún tipo de relación aleatoria, no causal, entre sa y los 
sucesos de r. 

Puesto que los sucesos de s son igualmente probables, /(s2) = dos bits. 
No obstante, al contrario que en la situación anterior, la ocurrencia de r» 
no supone la llegada de dos bits de información procedentes de s. Un 
cálculo de la equivocidad asociada con la señal rz de acuerdo con la fór- 
mula (1.8) revela que la equivocidad es ahora de 1,6 bits aproximada- 
mente. Por tanto, r> sólo lleva 0,4 bits de información sobre s!%. Dado lo 





15 Esto corresponde intuitivamente al hecho de que en el primer caso (figura 1.6) la señal r, 
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que, de hecho sucede, y las relaciones causales que existen de hecho, esta 
situación no se distingue de la anterior. No obstante, en términos informa- 
cionales, son completamente distintas. El argumento causal (figura 1-5) no 
nos dice cuánta información se transmite, porque no nos dice si la secuen- 
cia causal está inmersa en una red de posibilidades similar a la que se re- 
presenta en la figura 1-6 o en la figura 1-7. 

Es interesante señalar que, si en este último sistema comunicativo ocu- 
rriera sa, lo que ocurriera en r (r1, r3 o bien ra) llevaría los dos bits de in- 
formación sobre la fuente. Como la equivocidad asociada con la señal r; 
(también con rz y r4) es cero, este suceso (en caso de ocurrir) llevará toda 
la información asociada con la ocurrencia de s4. 

Desde el punto de vista de la vida cotidiana este resultado es perfecta- 
mente aceptable. Intuitivamente, la señal rz no «dice» lo que sucedió 
(exactamente) en s, mientras que r;, 13 y ra Sí. Así, pues, desde un punto 
de vista informacional, r¡ lleva más información que r sobre lo que suce- 
dió en s. A pesar de la débil relación causal existente entre sa y ri, y la 
relación causal fuerte que hay entre s, y r2, ri lleva más información que 
r, sobre s. Por término medio, las señales impredecibles se darán con mu- 
cha menor frecuencia que las predecibles (r>), pero cuando se den estarán 
totalmente llenas de información. 

Esto muestra que la transmisión de información de un punto a otro no 
depende de la existencia de procesos deterministas entre transmisor y re- 
ceptor. En todos los casos r, fue provocado, producido, causado y deter- 
minado por s2. En una de las situaciones que hemos imaginado (fig. 1-6), 
esta señal llevaba dos bits de información sobre s; en otra (fig. 1-7) conte- 
nía 0,4 bits de información. Se pueden imaginar situaciones en que con- 
tenga todavía menos información. Sin molestarnos en representarlo gráfi- 
camente, imaginemos a una persona que está mirando una carta: el tres de 
diamantes, por ejemplo. Y supongamos que sólo puede ver el reverso de 





«dice» al receptor lo que ocurrió en s (a saber, s2), mientras que en el segundo no lo hace. En 
el segundo caso la señal sólo le «dice» al receptor que ocurrió s; o bien s, o bien $3, y eso 
supone mucha menos información. Podríamos expresarlo diciendo que la primera señal lleva 
la información de que sucedió s, (dos bits), mientras que la segunda sólo lleva la información 
de que sucedió s, o bien s, o bien s3 (0,4 bits). Pero todo esto es prematuro. Todavía no hemos 
identificado nada como el contenido informativo de una señal o estado de cosas. Ahora nos 
ocupamos tan sólo de cuestiones cuantitativas: cuánta información lleva una señal, no de qué 
información lleva. 
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la misma. ¿Cuánta información recibe sobre la identidad de la carta? (es 
decir, sobre qué carta es). Dado que no puede ver la carta de frente y que 
todos los reversos son iguales, normalmente contestaríamos que no recibe 
ninguna información sobre qué carta es. Hay 52 posibilidades, y la señal 
que está recibiendo no le ayuda en absoluto a discernirlas. Pero, por hipó- 
tesis, la señal sensorial que está recibiendo tiene al tres de diamantes como 
antecedente causal; es esa carta en concreto la causalmente responsable 
de su experiencia sensorial. No obstante, a pesar de que ésa sea la carta 
que esté determinando el carácter de su experiencia sensorial, cualquiera 
de las cincuenta y una cartas restantes tendría, desde ese ángulo y esa dis- 
tancia, exactamente el mismo efecto. Eso es lo que significa que todas son 
iguales vistas boca abajo. Aunque exista una relación causal entre el tres 
de diamantes y la experiencia sensorial del sujeto, la experiencia sensorial 
del sujeto no contiene información sobre la identidad de su antecedente 
causal. Si s3 denota la extracción (aleatoria) del tres de diamantes, /(s3) 
=5,7 bits, pero ninguna parte de esa información está contenida en el efecto 
sensorial de ese suceso. 

Por supuesto, puede ocurrir que, aunque el mensaje sensorial no lleve 
ninguna información sobre qué carta es, lleve alguna información sobre la 
carta; por ejemplo, que es una carta. Pero incluso eso podría ser falso. 
Todo depende de si alguna otra cosa que no fuera una carta podría haber 
causado o no el mismo efecto (sensorial). Si suponemos que el sujeto está 
tan desorientado que sufre alucinaciones de cartas cuando no tiene ninguna 
delante, entonces el estado sensorial que le ha producido el tres de diaman- 
tes no lleva ni siquiera la información de que tiene una carta ante sí. Eso 
es perfectamente compatible con la suposición de que es el tres de diaman- 
tes, esta carta en concreto, la que está afectando al sujeto. Después de todo, 
está (por hipótesis) viendo el tres de diamantes, aunque sea por detrás, sea 
lo que fuere lo que ocurriría si es que no estuviera viendo una carta. El 
estado sensorial no tiene por qué llevar la información de que el estímulo 
distal es una carta y mucho menos que es el tres de diamantes, a pesar de 
que es una carta, y concretamente el tres de diamantes, la que hace que el 
sujeto tenga una experiencia sensorial. 

Por tanto, el efecto puede o no contener información sobre su causa. 
Esta posibilidad es la que hace tan fascinante la idea del crimen perfecto. 
Las acciones de A pueden causar la muerte de B, pero la muerte de B puede 
no dar testimonio de su causa. Desde el punto de vista de la teoría de la 
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información, el crimen perfecto es un acto ilegal cuyo efecto no contiene 
información sobre la identidad de los agentes causalmente responsables 
del mismo. La equivocidad es máxima. 

Del mismo modo que un efecto puede contener poca, o ninguna, infor- 
mación sobre su causa, un suceso puede llevar información sobre sucesos 
con los que no mantiene ninguna relación causal regular, como muestra la 
situación que se representa en la figura 1-7. La ocurrencia de ri (o r3 O ra) 
contiene los dos bits de información sobre la situación de s. Pero el proceso 
mediante el que esa información se transmite a r no es un proceso causal 
o, por lo menos, no es un proceso causal determinista. Podemos imaginar, 
por ejemplo, que en el punto en que la flecha que sale de s4 se divide en 
dos hay un sistema que aleatoriamente da lugar a r,, r3 o r4. Un electrón 
sale de sa, es bombardeado antes de llegar a r (en el punto de bifurcación), 
y llega impredeciblemente a uno de los tres lugares señalados con r;, ra y 
r3. A esto se le llama un proceso no determinista. Si la teoría cuántica es 
verdadera, y hay razones para pensar que lo es, no es posible, en principio, 
predecir adonde irá a parar el electrón. A veces irá a r¡, pero nada le obliga 
a caer allí. En idénticas circunstancias, en la mayoría de los casos irá a 
parar a alguno de los otros dos lugares. No obstante, cuando llegue a r;, 
contendrá dos bits de información sobre la fuente. 

Algunas personas no creen que haya procesos no deterministas en la 
naturaleza. En su opinión, la indeterminación asociada a los fenómenos 
cuánticos es consecuencia de la incompletud de nuestra teoría. Es nuestra 
ignorancia la que hace que r; parezca no estar determinado por las cir- 
cunstancias que le preceden, pero cuando consigamos (si es que la conse- 
guimos) una mejor comprensión de esos temas (sustituyendo entonces la 
teoría cuántica por otra que se aproxime más a la verdad) se verá que la 
ocurrencia de r; está estrictamente determinada, determinada por lo que en 
nuestro actual estado de ignorancia puede llamarse variables ocultas!*, 





16 Existe una gran cantidad de literatura sobre la polémica acerca de la existencia o no exis- 
tencia de consecuencias deterministas de la teoría cuántica. David Bohm es un famoso de- 
fensor de la tesis de la «variable oculta»; véase su Quantum Theory (Prentice-Hall, Engle- 
wood Cliffs, N. J., 1951) y en una postura más polémica, su Causality and Chance in Módem 
Physics (Londres, 1957). Véase también The Concept of the Positrón (Cambridge University 
Press, 1963), de Norwood Hanson, y la discusión de Paul Feyerabend y Hanson en Current 
Issues in the Philosophy of Science, Herbert Feigl y Grover Maxwell (eds.), Holt, Rinehart 
and Winston, Nueva York, 1961, para un repaso escolar del trasfondo de este problema, véase 
The Conceptual Development of Quantum Mechanics, de Max Jammer (McGraw-Hill, 
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Para nuestros propósitos no es necesario discutir esta cuestión. Lo im- 
portante no es si el determinismo universal es verdadero o no. Sólo se ha 
suscitado la cuestión para mostrar que, incluso sí en la naturaleza hay pro- 
cesos no deterministas, eso no supone ningún obstáculo para la transmi- 
sión de información. Como muestra el ejemplo anterior, r2 estaba determi- 
nado por s» y, no obstante, llevaba menos información sobre la fuente que 
no lo estaba. 

Podría parecer que estoy confundiendo determinismo y causalidad. Se 
podría decir, por ejemplo, que aunque s« no determina lo que sucederá en 
r, sí que causa o provoca ri (o r3 0 ra, independientemente de lo que suceda 
en r). La causalidad no implica el determinismo. Todo evento puede tener 
una causa sin que tenga que estar necesariamente determinado, sin que sea 
(en principio) predecible. 

Hay un cierto fundamento para esa acusación. Al afirmar que la causa- 
lidad no es necesaria para el flujo de la información, he supuesto que: 


Si C es la causa de E, entonces C es una parte esencial de alguna condición 
nómicamente suficiente de E. 


Este principio expresa una idea tradicional, la idea de que C no puede 
ser causa de E si puede suceder (algo similar a) C en circunstancias pare- 
cidas en un sentido pertinente, sin que suceda (algo parecido a) £. En otras 
palabras, la causalidad es la manifestación de una sucesión nómica regular 
entre sucesos del tipo C y E en condiciones pertinentemente similares,!” 
Dado que en nuestro hipotético ejemplo suponíamos que la ocurrencia de 
r¡ era una cuestión de azar, algo que no estaba determinado por sa, no hay 
ninguna sucesión regular entre sucesos similares a s4 y sucesos similares 
a ri. A veces r¡ sucede cuando ha ocurrido sa, pero otras veces, en las mis- 





Nueva York, 1966), especialmente los capítulos 7 y 9. 


17 Esta es una concepción empirista ortodoxa de la causalidad. Su antepasado más ilustre 
es, por supuesto, David Hume, pero no es necesario aceptar la tesis de Hume de que la cau- 
salidad es tan sólo una cuestión de sucesión regular para adherirse a la idea, que se expresa 
en el principio anterior, de que la causalidad supone, por lo menos, una sucesión regular. Una 
útil colección de artículos, algunos de los cuales exponen la doctrina de la regularidad, es la 
de Tom L. Beauchamp (ed.), Philosophical Problems of Causation, Dickenson Publishing 
Co., Encino, Calif., 1974. 
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mas circunstancias, r, no sucede (sucede r3 o r4). Por tanto, según el prin- 
cipio anterior, sa no es la causa de r¡. De hecho, nada causa r; si, como 
hemos supuesto, no hay condiciones nómicamente suficientes para que 
ocurra. 

Que se suponga que la causalidad es o no necesaria para el flujo de la 
información depende, por supuesto, de lo que se entienda por causalidad. 
Si aceptamos que el principio anterior forma parte del concepto de causa- 
lidad, estaremos obligados a concluir que s4no era la causa de r, (nada lo 
era). Sin embargo, si se rechaza este análisis de la causalidad, se puede 
sostener (dependiendo del análisis alternativo que se proponga) consisten- 
temente que aunque nada sea suficiente para que ocurra r;, aunque este 
suceso no esté determinado, ha sido provocado, o causado, por sq.!* 

Este no es el momento de emprender un análisis exhaustivo de la cau- 
salidad.!? Para nuestros propósitos bastará con decir algo de naturaleza 
condicional, a saber: si se considera que la causa de un evento es una parte 
esencial de alguna condición nómicamente suficiente para que suceda ese 
evento, entonces no es necesario que exista una relación causal entre A y 
B para que se transmita información de A a B. El suceso B puede contener 
la información de que ocurrió A incluso si A y B no están causalmente 
relacionados en este sentido, incluso si, en este sentido, no existe ninguna 
causa de B. En adelante, cuando hable de una relación causal entre dos 
sucesos, me referiré a una relación causal en este sentido tradicional del 
término. Lo que se diga no será necesariamente válido si se considera que 
la relación de causalidad no exige regularidad de sucesión (de los tipos de 
eventos en circunstancias pertinentemente idénticas). 

A la luz de estos hechos (y decisiones terminológicas) debe quedar 
clara la diferencia entre una relación causal y una relación informacional. 
No se puede responder a la mayoría de las preguntas sobre el flujo de la 
información con las descripciones detalladas de los procesos causales que 





18 Tal análisis se considera en «Causal Regularity», Philosophy of Science, marzo 1972, y 
«Causal Sufficiency: A Reply to Beauchamp», Philosophy of Science, junio 1973, cuyos au- 
tores somos Aaron Snyder y yo. 


12 Un intento reciente es el de J. L. Mackie, The Cement of the Universe: A Study of Cau- 
sation, Clarendon Press, Oxford, 1974. 
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intervienen en la transmisión de una señal. Se puede obtener toda la infor- 
mación sin causalidad, y puede no obtenerse ninguna información con ella. 
Entre esos dos extremos existe toda la gama de grados intermedios. 

Para entender la diferencia existente entre una teoría del conocimiento 
basada en la teoría de la información y una teoría causal del conocimiento 
es necesario tenerla en cuenta. Por ejemplo, a veces se supone negligente- 
mente que, como la reflexión de la luz de un objeto causa determinados 
eventos en la periferia de nuestros receptores visuales, y esos eventos (el 
estímulo proximal) causan a su vez otros eventos en el sistema nervioso 
central que, finalmente, provocan algún tipo de respuesta por parte del or- 
ganismo, el sujeto ha recibido información (en algún sentido no definido 
del término) sobre el estímulo distal (el objeto cuya luz se reflejaba). Esa 
conclusión no está justificada. El sujeto puede recibir muy poca o ninguna 
información de ese estímulo. Es posible que no reciba la información de 
que hay un objeto delante de él, y menos todavía información sobre qué 
objeto o tipo de objeto es. No se puede responder a la pregunta de si ha 
recibido o no información con una descripción muy detallada de lo que 
tiene lugar en el contacto perceptivo. 

El hecho de que un pequeño insecto que se mueve sobre un fondo ilu- 
minado estimule un determinado conjunto de neuronas del cerebro de una 
rana y éste, a su vez, provoque una respuesta por parte de la rana (cazar el 
insecto con su lengua) no significa que las neuronas o la rana reciban la 
información de que hay un insecto cerca de allí. Podrían estar recibiendo 
esta información, pero el hecho de que el insecto que se está moviendo 
provoque una respuesta distintiva (tanto de la célula como de la rana) no 
implica por sí mismo que se transmita información alguna en esas interac- 
ciones. Para analizar esta situación en términos de teoría de la información 
se necesita saber qué es lo que causa la estimulación de las neuronas (o 
que la rana cace al mosquito). Se necesita saber qué otra cosa, si es que la 
hay, produce esta respuesta. El muchacho que gritaba «lobo» como res- 
puesta a que un lobo estaba atacando a su rebaño no comunicaba la infor- 
mación de que había un lobo. La razón por la que no lo hacía es que su 
grito de «lobo» era también la forma en que respondía ante otras situacio- 
nes distintas, situaciones que no implicaban la presencia de un lobo. Si las 
células neurales que «gritan» como respuesta a un insecto en movimiento 
también reaccionan de forma pertinentemente similar a otro tipo de estí- 
mulos, entonces no llevan la información de que hay un insecto cerca de 
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allí. En este caso hipotético, aunque la reacción de las células neurales se- 
guiría estando causada por un mosquito que se mueve —y causaría, a su 
vez, que se disparase la lengua de la rana—, esas células no llevarían la 
información de que había un mosquito que cazar. Si la rana cazase al mos- 
quito, tendría suerte, del mismo modo que el muchacho que gritaba «lobo» 
sería afortunado si algún cazador respondía a su vigésimo grito en el mo- 
mento en que, al parecer, y por primera vez, estaba realmente provocado 
por un lobo. 

Eso no es más que una forma de decir que, para los propósitos infor- 
macionales, hay que saber si la situación causal es parecida a la de la figura 
1-6 o a la de la figura 1-7. No basta con saber qué es lo que causó la des- 
carga neural; para determinar la medida informacional de un evento hay 
que saber algo sobre sus posibles antecedentes, ya sean causales o de otro 
tipo. 

Con este ejemplo no pretendo sugerir que los científicos que describen 
esos experimentos con ranas, y que se refieren a algunas de esas células 
neurales como «detectores de insectos», estén equivocados respecto a la 
distinción entre una relación causal y una relación informacional. Parece 
claro que a algunas neuronas se las llama «detectores de insectos» no sólo 
por el hecho de que un insecto en movimiento causa su reacción, sino por- 
que, en el hábitat natural de las ranas, tan sólo un insecto en movimiento 
(o algún otro estímulo pertinentemente equivalente) las hace reaccionar. 
Es esta relación informacional con el estímulo lo que convierte a la célula 
neural en merecedora del nombre de detector de insectos. 

W. R. A. Muntz señala claramente este punto en su examen de la visión 
del color en las ranas.?! Algunas células del tálamo dorsal de la rana son 
sensibles no sólo a la presencia o ausencia de luz, sino también al color de 





20 «Cuando esta fibra responde mejor es cuando un objeto oscuro, más pequeño que un 
campo receptor, entra en ese campo, se para y después sigue moviéndose intermitentemente. 
La respuesta es la misma si cambia la iluminación o el fondo (por ejemplo, una pintura o bien 
hierba y flores) se mueve, y no se produce si en el campo receptor sólo está el fondo, ya sea 
estático o en movimiento. ¿Se podría describir un sistema mejor para detectar un insecto que 
está al alcance?» J. Y. Lettvin, H. Maturana, W. S. McCulloch y W. H. Pitts, «What the 
Frog's Eye Tells the Frog”s Brain», Proceedings of the IRE, vol. 47, pág. 151. 


21 «Vision in Frogs», Scientific American, marzo 1964; reimpreso en Perception: Mecha- 
nisms and Models con introducciones de Richard Held y Whitman Richards, W. H. Freeman 
and Company, San Francisco, 1971, págs. 157-164. 
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ésta. Esas células responden mucho más intensamente a la luz azul que a 
la de cualquier otro color. La pregunta que hace Muntz es si esta respuesta 
selectiva es una mera dependencia cromática o bien auténtica visión del 
color. Esta diferencia se ilustra mediante las células retínales humanas lla- 
madas bastoncillos. Estas células, que son las responsables de la visión 
cuando hay poca luz, centellean de forma especialmente intensa ante la luz 
azul-verdosa. En este sentido son cromáticamente dependientes. «Sin em- 
bargo, los bastoncillos no pueden proporcionar visión del color, porque no 
pueden distinguir entre un azul-verdoso poco intenso y, por ejemplo, un 
amarillo muy intenso.»?? Aunque Muntz no habla en términos de teoría de 
la información, esta distinción es la misma que la que acabamos de ver: la 
distinción entre una relación causal y una auténtica relación informacional. 
Aunque la luz azul-verdosa causará que los bastoncillos centelleen con 
cierta frecuencia, la luz amarilla o de una intensidad suficiente los hará 
centellear con la misma frecuencia. Por tanto, la frecuencia del centelleo 
no lleva la información ni siquiera cuando el estímulo es la luz azul-ver- 
dosa. Dado que la descarga neural de esos bastoncillos es equívoca res- 
pecto al color (longitud de onda) del estímulo, no contiene la información 
de que el estímulo es azul-verdoso (y no, por ejemplo, amarillo). Los bas- 
toncillos llevan información, pero no información sobre el color o la luz 
que penetra, sino sobre la intensidad relativa de la porción azul-verdosa 
del espectro del estímulo. Dado que un azul-verdoso pálido y un amarillo 
intenso son iguales a este respecto, la célula no puede distinguirlos. Aun- 
que las células centellean a causa de la luz azul-verdosa, son ciegas al co- 
lor. No llevan ninguna clase de información sobre el color que las hace 
centellear. 

Estos ejemplos ilustran el hecho de que una relación causal entre A y 
B no basta para la comunicación de información entre A y B. Pero también 
hemos sugerido que no era necesario que existiera una relación causal en- 
tre esos dos puntos para que entre ellos fluyera información. ¿Es eso una 
mera posibilidad teórica, o bien existen casos reales en que eso ocurre? Es 
bien sabido que los procesos mediante los cuales nuestros receptores vi- 
suales extraen información de la luz que entra son procesos no determinis- 
tas. Por ejemplo, los fotones se pigmentan en el pigmento fotosensible de 
los bastoncillos y los conos de la retina. La absorción de esos fotones por 





2 Ibíd., pág. 160. 
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parte del pigmento, con la consiguiente transmisión de una vibración eléc- 
trica a las células ganglionares (un conjunto de células relativamente peri- 
férico que hace de intermediario en la transmisión de la señal al cerebro) 
es un proceso cuántico. Cuando llegan, pongamos por caso, seis fotones a 
la superficie de los bastoncillos, altamente sensibles (que se usan para la 
visión nocturna), puede ser que no se absorba ninguno, o todos, o que se 
absorba cualquier número de fotones entre uno y seis. No se puede, en 
principio, predecir cuántos fotones serán absorbidos. Todo lo que se puede 
decir son las distintas probabilidades de n absorciones. Resulta que basta 
con que se absorban muy pocos fotones para generar un impulso en las 
células ganglionares, con la consiguiente transmisión de una señal al cere- 
bro y la ocurrencia de una experiencia visual (como un «centelleo» de luz). 
Supongamos, para ilustrar lo que acabamos de decir, que la absorción de 
cuatro fotones dé lugar a una sensación de luz.?% Si disponemos las cosas 
de tal manera que se produzca un destello de luz de muy baja intensidad 
(que arroja a la retina un promedio de tan sólo seis fotones por cada deste- 
llo), tendremos una situación muy similar a la de sa y r¡ en la figura 1-7. A 
veces (cuando se absorben cuatro o más cuantos) se producirá una sensa- 
ción (r1). Otras veces (cuando se absorbe menos de cuatro cuantos) no se 
producirá ninguna (73 o r4). Según la teoría cuántica, no se puede predecir 
cuándo el sujeto experimentará este «centelleo» de luz. No está determi- 
nado. Pero eso no impide que la sensación de luz lleve información sobre 
la débil luz control. Supongamos que hay un bit de información asociado 
a la luz control: la luz está encendida o apagada, y cualquiera de las dos 
cosas es igualmente probable. Dado que no hay más que dos posibilidades 
y que ambas son igualmente probables, /(s), la cantidad de información 
que genera el que la luz esté encendida, es un bit. Si la luz es tan débil que 
sólo se produce una sensación (se absorben cuatro o más fotones) en el 
50% de los casos en que centellea la luz, la cantidad media de información 





23 Esto no es una imagen irreal. «Sin embargo, el mínimo de cuantos de luz que se necesitan 
para la visión no es muy grande. Unos pocos cuantos que actúen sobre la retina humana 
pueden dar la sensación de luz a un observador humano. Activando una molécula de un pig- 
mento visual, un único cuanto puede causar la excitación de un bastoncillo acostumbrado a 
la oscuridad que se encuentre en la retina. Y un cuanto es, por supuesto, la menor cantidad 
de luz que la materia puede emitir o absorber.» M. H. Pirenne y F. H. C. Marriott, «The 
Quantum Theory of Light and the Psycho-Physiology of Vision», en Psychology: The Study 
ofa Science, Sigmund Koch (ed.), Nueva York, 1959. 
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transmitida desde la luz al sujeto de la percepción es baja. Sin embargo, si 
suponemos que la sensación sólo se produce en el momento en que la luz 
está encendida,?* entonces la sensación, cuando tiene lugar, lleva todo un 
bit de información. Contiene la información de que la luz está encendida. 
Lleva esta información por la misma razón que r¡ llevaba la información 
de que sucedía sa: es decir, la equivocidad de la señal es 0. 

Tal vez sea éste un ejemplo extremo de información transmitida a tra- 
vés de un canal no determinista, pero, a pesar de ello, ilustra un fenómeno 
que se da con frecuencia en la comunicación y recepción de información. 
Consideremos el circuito de un timbre que tiene un cable flojo. La mayoría 
de las veces el timbre no funciona, porque el cable flojo hace que el cir- 
cuito quede interrumpido. Pero de vez en cuando factores de dispersión 
hacen que el cable haga contacto y se cierre el circuito. Si suponemos que 
el timbre no sonará a menos que alguien pulse el botón, está claro que el 
hecho de que éste suene indica que alguien llama a la puerta. Por lo menos 
contiene la información de que el botón está siendo oprimido, y contiene 
esa información a pesar de que a menudo el timbre no suena cuando se 
aprieta el botón. Desde el punto de vista de un ingeniero, este circuito 
constituye un canal de comunicación muy insatisfactorio (la cantidad me- 
dia de información transmitida es muy baja). No obstante, como hemos 
visto, eso no impide que de vez en cuando el sistema transmita tanta infor- 
mación como puede comunicar un sistema que funcione perfectamente 
bien. Los jugadores que tienen un promedio de bate bajo consiguen a veces 
un buen golpe. La única diferencia entre este ejemplo y el anterior es que 
estamos convencidos de que los «factores de dispersión» antes menciona- 
dos no son realmente indeterministas. Lo que nos dice el ejemplo anterior 





24 El supuesto no es demasiado plausible, ya que, en niveles mínimos, la actividad espon- 
tánea de las células receptoras («luz oscura») generará a veces un tipo de respuesta que no se 
distinguirá del generado por el estímulo control de baja intensidad. Es decir, a veces, incluso 
cuando la luz esté apagada, las fuentes térmicas del ojo y la actividad de los vasos sanguíneos 
estimularán las células receptivas en un grado que será suficiente para simular la absorción 
de cuatro fotones por parte del pigmento visual. Por eso es exagerado decir que cuando se 
produce la sensación ésta lleva un bit entero de información sobre la luz control. Hay una 
cierta equivocidad, porque la cantidad de información depende de la cercanía al umbral. Una 
exposición más completa de estas cuestiones se encontrará en David E. Rumelhart: Introduc- 
tion to Human Information Processing, John Wiley £ Sons, Nueva York, 1977, capítulo 1. 
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es que, incluso si lo fueran, eso no supondría ningún tipo de obstáculo 
insalvable para la comunicación de información. 

Cuando hablamos de una señal que lleva información, nos referimos 
normalmente a algún proceso físico que sufre una propagación de un lugar 
a otro en el espacio (luz, corriente eléctrica, ondas acústicas, etc.) o un 
objeto físico, adecuadamente inscrito, que es transportado de aquí a allá 
(cartas, libros, figuras, etc.). Estas son las expresiones o realizaciones ma- 
teriales del canal de comunicación. No obstante, desde un punto de vista 
teórico, el canal de comunicación propiamente dicho se puede considerar 
y de hecho se considera como, el mero conjunto de relaciones de depen- 
dencia entre s y r. Si las relaciones estadísticas que definen la equivocidad 
y el ruido entre s y r son adecuadas y correctas, entonces existe un canal 
entre esos dos determinados puntos, y por consiguiente pasa información 
de uno a otro, aunque no haya ningún nexo físico directo que una s y r. 
Consideremos, por ejemplo, la situación que hallamos representada la fi- 
gura 1-8. 


FIG. 1.8 


A transmite tanto a B como a Ca través de algún canal físico (indicado 
mediante líneas continuas). B y C están aislados el uno del otro en el sen- 
tido de que no hay ninguna señal física que pase directamente de uno a 
otro. Aunque B y C están físicamente aislados, existe a pesar de ello un 
nexo informacional entre ellos (representado mediante una línea disconti- 
nua). Según la teoría de la información, hay un canal entre B y C.«A causa 
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de la común dependencia de B y C respecto de A se podrá saber algo acerca 
de C mirando a B, y viceversa. Es correcto decir que existe un canal en el 
sentido de la teoría de la comunicación entre B y C.»” Llamemos al canal 
entre B y C canal «fantasma». Se puede considerar que dos receptores de 
televisión que sintonizan el mismo canal están unidos mediante un canal 
fantasma. En cada uno de esos receptores hay información sobre el otro. 
La correlación existente entre los acontecimientos que tienen lugar en las 
pantallas de ambos receptores no es accidental. No es ninguna coinciden- 
cia que la publicidad interrumpa un programa al mismo tiempo que inte- 
rrumpe el otro. La información que hay en B sobre C, Ic(B), es igual que 
la información generada en C, I(C), a pesar de que no existe ningún canal 
físico entre ambos. 

Todavía hay que distinguir el nexo informacional entre B y C de un 
nexo causal en otro sentido. No hay nada en B que cause C, ni viceversa. 
Pero C contiene información sobre B, y B sobre C. Si C está más lejos que 
B del transmisor, los eventos que suceden en C pueden ocurrir más tarde 
que los de B. Eso no importa a la hora de evaluar la relación informacional 
entre B y C. Aunque C suceda más tarde, B lleva información sobre lo que 
ocurrirá en C (la recibe, por así decirlo, de 4). Eso sólo parece extraño si 
se confunde la recepción de información con la causalidad, ya que, por 
supuesto, no hay ninguna señal física que pueda viajar hacia atrás en el 
tiempo llevando información de Ca B. 

Las teorías del conocimiento que exigen la existencia de algún tipo de 
nexo causal entre cognoscente y conocido suelen encontrar dificultades 
cuando tratan el tema de nuestro supuesto conocimiento del futuro. Por 
ejemplo, ¿cómo pueden los ocupantes de B saber algo sobre los eventos 
que sucederán en C cuando éstos todavía no han tenido lugar (y, por tanto, 
no pueden causar nada que esté ocurriendo en B ahora)? Para solucionar 
este problema se añaden cláusulas especiales a la teoría causal del conoci- 
miento, de tal manera que sea posible tal conocimiento.? Se presentan 
como explicaciones de lo que se quiere decir mediante la conexión causal 





25 Henry Quastler, «Information Theory Terms and Their Psychological Correlates», en 
Information Theory in Psychology: Problems and Methods, Henry Quastler (ed.), Free Press, 
Glencoe, 111., 1955, pág. 152. 


26 Estoy pensando en el famoso artículo de Alvin Goldman, «A Causal Theory of Kno- 
wing», Journal of Philosophy, vol. 64, 12 (22 de junio de 1967), págs. 335-372. 
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que se exige entre el sujeto cognoscente y el estado de cosas que se sabe 
que existe. Tienen como efecto permitir que los ocupantes de B sepan lo 
que ocurrirá en C. Goldman, por ejemplo, dispone las cosas de tal manera 
que, incluso cuando no existe ningún nexo causal directo, alguien que esté 
en B puede saber lo que ocurrirá en C si los eventos de B y C tienen un 
antecedente causal común.?” Eso basta para satisfacer las exigencias cau- 
sales de su teoría. Desde el punto de vista de una teoría de la información, 
tales aditamentos son superfluos, meras formas epicíclicas de intentar cap- 
tar en terminología causal la idea de un nexo informacional entre dos pun- 
tos. El único sentido en que el conocimiento requiere causalidad es aquel 
en que requiere información, y con esta exigencia no es necesario distin- 
guir un caso especial para situaciones de este tipo. 





27 Este es el tipo de conexión causal que Goldman llama Patrón 2 y que se ilustra en la 
figura 3 de «A Causal Theory of Knowing». 
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2. Comunicación e información 


La teoría de la comunicación pretende decirnos algo acerca de la infor- 
mación, si no lo que es, sí por lo menos cuánta hay. Cuando en el capítulo 
anterior esbozábamos los elementos de esta teoría, elegimos cuidadosa- 
mente los ejemplos que apoyaban esta afirmación. Pero esa es una cuestión 
polémica. Se ha dicho que es mejor considerar a la teoría de la información 
como una teoría de la transmisión de señales, una teoría sobre esos eventos 
físicos (señales) que, en algún sentido, llevan información.?8 En este enfo- 
que las señales son una cosa, y la información que llevan, su contenido 
semántico, otra. La teoría matemática de la información puede ser un ins- 
trumento elegante para codificar las características estadísticas de esos 
eventos físicos de los que depende la comunicación y las dependencias 
mutuas entre ellos. Pero la información tiene que ver, no con los medios 
que usamos para comunicarnos, sino con lo que comunicamos mediante 
ellos. Una auténtica teoría de la información sería una teoría sobre el con- 
tenido de nuestros mensajes, no una teoría sobre el modo en que se expresa 
este contenido. 

La señal son dos golpes; el mensaje es que no hay moros en la costa. 
Eso está claro. También se puede distinguir entre el agua del cubo y el 
cubo que contiene el agua. Pero, a pesar de ello, podemos medir el cubo 





28 Bar-Hillel y Rudolf Carnap son, tal vez, los más famosos (para los filósofos) críticos de 
la idea de que la teoría estadística de la información pueda ser un instrumento adecuado para 
los estudios semánticos. Su intento de desarrollar una auténtica teoría semántica de la infor- 
mación que se encuentra en su «An Outline of a Theory of Semantic Information», Informe 
Técnico 247 del Research Laboratory of Electronics, Massachusetts Institute of Technology, 
1952; reimpreso como capítulo 15 de Language and Information, de Bar-Hillel. Véase tam- 
bién los artículos de Bar-Hillel «An Examination of Information Theory» y «Semantic Infor- 
mation and Its Measures», reimpresos como capítulos 16 y 17 de Language and Information, 
Reading, Mass., 1964. Véase también el ensayo introductorio de Wa rren Weaver a The Mat- 
hematical Theory of Communication, de Shannon y Weaver; Colin Cherry, On Human Com- 
munication, Massachusetts Insti tute of Technology, 1957, pág. 50; Jaakko Hintikka, «On 
Semantic Infor mation», en Information and Inference, J. Hintikka y P. Suppes (eds.), D 
Reidel Publishing Company, Dordrecht, 1970; y Max Black, «How Do Pictures Represent?», 
en Art, Perception and Reality de E. H. Gombrich, Julian Rochberg y Max Black, Baltimore, 
Ma., 1972. 
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para averiguar qué cantidad de agua contiene. ¿Por qué, entonces, no se 
puede determinar el contenido informativo de una señal o, por lo menos, 
la cantidad de información que contiene, midiendo la señal misma? 

Shannon ha dicho que los aspectos semánticos de la comunicación no 
son pertinentes para la cuestión técnica,” y, en efecto, no lo son. No obs- 
tante, como señala Warren Weaver contra la observación de Shannon: 
«Pero eso no significa que los aspectos técnicos no puedan ser pertinentes 
para los aspectos semánticos.»*” Esta es la línea que voy a tomar y desa- 
rrollar en el presente capítulo. La teoría de la comunicación no nos dice 
qué es la información. Pasa por alto las cuestiones relativas al contenido 
de los signos, cuál es la información específica que contienen, para descri- 
bir cuánta información contienen. En este sentido, Shannon está en lo 
cierto: los aspectos semánticos no son pertinentes para los problemas téc- 
nicos. No obstante, al decirnos cuánta información contiene una señal, la 
teoría de la comunicación impone ciertas restricciones a la información 
que puede contener una señal. Estas restricciones pueden, a su vez, usarse 
para desarrollar una explicación de la información que contiene una señal. 
En este sentido Weaver está en lo cierto: la teoría de la comunicación es 
pertinente para la determinación del contenido informativo de una señal. 
La medida de un cubo de un galón no puede decirnos, exactamente, lo que 
hay en el cubo, pero puede decirnos algo acerca de lo que puede haber en 
el cubo. Puede decirnos, por ejemplo, que no puede contener dos galones 
de limonada. Y, si sabemos, que el cubo contiene o bien dos galones de 
limonada o bien un galón de cerveza, la medida del cubo determinará, sin 
lugar a error, el contenido del cubo. 





22 The Mathematical Theory of Communication, pág. 31. 


30 Ibíd., pág. 8. Creo que Kenneth Sayre dice lo mismo cuando observa que, aunque tal vez 
la comunicación de contenido semántico no sea necesaria para la comunicación de informa- 
ción en el sentido que este término tiene en teoría de la información, ésta puede ser necesaria 
para aquélla: «A pesar de que tal vez esta información no tenga contenido semántico, es una 
condición necesaria para la comunicación de cualquier otro tipo de información el que se 
comunique alguna información. Si un sistema comunicativo no pudiera transmitir determi- 
nadas secuencias de símbolos de una forma inequívoca y reproducible, sería, por esta razón, 
incapaz de transmitir fiablemente mensajes con significación semántica.» Recognition: A 
Study in the Philosophy of Artificial Intelligence, University of Notre Dame Press, 1965, pág. 
229. 
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El concepto común de información 


¿Cuáles son, pues, los «aspectos semánticos» de la información, esos 
aspectos que la teoría de la comunicación no llega a captar? Weaver ad- 
vierte al lector de que en esta teoría la palabra «información» se usa en un 
sentido especial que no ha de confundirse con su uso corriente. En parti- 
cular, dice, la información (tal como se usa el término en teoría de la co- 
municación) no ha de confundirse con el significado,?" Otros expertos 
aconsejan al lector que no confunda el significado de la palabra informa- 
ción en esta teoría con el valor de la información recibida, con su impor- 
tancia o verdad,* o con el conocimiento.** La mayoría de los expertos se 
adherirían a la opinión de Cherry, según la cual la teoría no se ocupa del 
significado o la verdad de los mensajes; la semántica está más allá del al- 
cance de la teoría matemática de la información.** 

Estas advertencias son beneficiosas si se toman como antídoto contra 
los excesos de algunos investigadores. Norbert Wiener, por ejemplo, trata 
deliberadamente como sinónimas las expresiones «cantidad de informa- 
ción» y «cantidad de significado». Dice: «La cantidad de información se 
puede medir. Resulta que cuanto menos probable es el mensaje, más sig- 
nificado contiene, lo cual es totalmente razonable desde el punto de vista 
del sentido común.»** Sólo es necesario un poco de reflexión para darse 
cuenta de que eso no es «totalmente razonable» desde el punto de vista del 
sentido común. No existe una simple igualdad entre significado (o canti- 
dades de significado) e información (o cantidades de información) tal y 
como esta última se concibe en teoría de la información. La proferencia 





31 Ibíd., pág. 8. 
32 Wendell R. Garner, Uncertainty and Structure as Psychological Concepts, págs. 2-3. 
33 Cherry, On Human Communication, pág. 9. 


34 Lejaren Hiller y Leonard Isaacson, «Experimental Music», en The Modeling of Mind: 
Computers and Intelligence, Kenneth M. Sayre y Frede- rick J. Crosson (eds.), Nueva York, 
1963, pág. 54; reimpreso de Experimental Music por L. Hiller y L. Isaacson, McGraw-Hill, 
1959. 


35 «A History of the Theory of Information», Proceedings of the Institute of Electrical En- 
gineers, vol. 98 (ID) (1951), pág. 383. 


36 Norbert Wiener, The Human Use of Human Beings, Houghton Mifflin Company, Boston, 
1950, pág. 8 (como lo cita Bar-Hillel en «An Examination of Information Theory», pág. 288). 
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«Hay un ñu en mi jardín» no tiene más significado que «Hay un perro en 
mi jardín» por el hecho de que la primera sea, estadísticamente, menos 
probable. Ni siquiera está claro que se pueda hablar, de este modo, de 
«cantidades de significado» de una manera razonable, y mucho menos 
identificarlas con la rareza estadística de los signos que tienen significado. 
Continuar por esta vía nos llevaría a la absurda opinión de que el galima- 
tías tiene más significado para los hablantes competentes que el discurso 
sensato, porque el primero es mucho menos frecuente. 

No obstante, para mis propósitos, la cuestión del significado está aquí 
fuera de lugar. La cuestión no es si la teoría de la comunicación nos pro- 
porciona una explicación del significado, sino si nos proporciona una ex- 
plicación de la información. Si bien la información, tal como ésta se con- 
cibe ordinariamente, puede ser un concepto semántico, eso no significa 
que debamos identificarla con el concepto de significado, ya que, a pri- 
mera vista, no hay razón para pensar que todos los signos con significado 
tengan que contener información o, si la contienen, que la información que 
contienen deba ser idéntica a su significado. 

Por ejemplo, hace poco un adversario en un campeonato de bridge por 
parejas me preguntó qué es lo que significaba la declaración de mi com- 
pañero. Mi compañero había declarado «cinco tréboles» respondiendo a 
un «cuatro no triunfo» (convención de Blackwood). Yo respondí que sig- 
nificaba que él tenía o bien ninguno o bien cuatro ases. Ese es el signifi- 
cado convencional de esa declaración, y el significado de todas las decla- 
raciones debe ser revelado a los adversarios. Sin embargo, mi adversario, 
perplejo ante nuestra subasta un tanto extravagante (y, sin duda, también 
por la mirada incrédula que dirigí a mi compañero), insistió: «Sé lo que 
significa. Lo que quiero saber es lo que te dijo su declaración, la informa- 
ción que obtuviste de ella.» Eso es, evidentemente, otra cosa, se trata de 
una pregunta a la que (dadas las reglas del bridge por parejas) no estoy 
obligado a responder, ya que la información que me había proporcionado 
la declaración de mi compañero era que no tenía ningún as. Esa informa- 
ción me fue comunicada porque yo tenía tres ases y, por tanto, él no podía 
tener los cuatro. Mi adversario (que no tenía ningún as) no recibió esa in- 
formación, todo lo que podía decir (dada la declaración de mi pareja) era 
que éste tenía ninguno o cuatro ases. Decirle qué información había sido 
comunicada mediante la declaración de mi pareja hubiera supuesto reve- 
larle una parte de mi propia mano (a saber, que yo tenía al menos un as). 
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Por tanto, aunque estaba obligado a decirle lo que significaba la declara- 
ción, no estaba obligado a revelarle la Información que había recibido. 

En este caso, la información contenida en una señal es (en cierto sen- 
tido) mayor que el significado convencional de la señal. Lo mismo suele 
ocurrir en las comunicaciones verbales ordinarias. Si yo ya sé que alguien 
vive en Wisconsin, pero el lector no lo sabe, el oírle decir que vive en 
Madison me dice a mí donde vive, pero no al lector. Una mirada al calen- 
dario sólo nos dice la fecha si ya sabemos en qué día de la semana estamos. 
Lo que dice, o puede decir, una señal (evento, condición o estado de cosas) 
y, por tanto, la información que esa señal contiene, depende en parte de lo 
que ya sabemos de las posibilidades alternativas. 

Por otra parte, un evento o estado de cosas que no tiene ningún signi- 
ficado convencional puede contener gran cantidad de información. Un ju- 
gador de póquer experto puede interpretar los indicios, puede ver o estar 
razonablemente convencido de cuándo el adversario se está echando un 
farol. Los gestos nerviosos de su adversario, una apuesta demasiado alta y 
una forzada apariencia de confianza revelan que no las tiene todas consigo, 
del mismo modo en que lo haría una mirada furtiva a su última carta. En 
esa situación se comunica información, pero el vehículo que transporta la 
información (el comportamiento y las acciones del adversario) no tiene 
significado en el sentido semántico del término.” 

Además, ni siquiera cuando el vehículo de comunicación es un signo o 
conjunto de símbolos con significado, es necesario que exista una corres- 
pondencia entre el significado de los símbolos y la información que pro- 
porcionan. Si no tengo dolor de muelas, el hecho de que diga que me due- 
len las muelas no informa de que tengo dolor de muelas. Las palabras que 





37 Hay, por supuesto, un uso del término «significado» cercano (si no equivalente) al sentido 
habitual de «información». Cuando decimos, por ejemplo, que un fusible fundido significa 
que el circuito estaba sobrecargado, una máquina que chisporrotea significa que se ha aca- 
bado el gas, y que las huellas digitales de George en el cristal significan que estaba en la 
escena, usamos «significado» en lo que Paul Grice llama su sentido natural. Cuando digo 
que hay que distinguir la información del significado, pienso en el significado en el sentido 
no natural de Grice, en el sentido del significado que importa al lenguaje y a los estudios 
semánticos. La forma en que los granos significan el sarampión (significado natural) es to- 
talmente distinta de la forma en que «tengo el sarampión» significa que (el hablante) tiene el 
sarampión (significado no natural), y es esta última clase de significado la que quiero distin- 
guir de la información. Véase el artículo de Grice «Meaning», Philosophical Review, vol. 66 
(1957), págs. 337-338. 
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pronuncio, «tengo dolor de muelas» tienen significado. Significan que 
tengo dolor de muelas. Pero, independientemente de lo que se piense o 
crea a consecuencia de habérmelas oído decir, no es ésa la información 
que llevan. 

La información que contiene una señal (lingiística o de otro tipo) sólo 
está relacionada con su significado (si es que lo tiene) de una manera ac- 
cidental. Normalmente, por supuesto, nos comunicamos, intercambiamos 
información explotando el significado convencional de los signos. Expre- 
samos información usando signos que tienen un significado que corres- 
ponde a la información que queremos expresar. Pero eso no debe hacernos 
confundir el significado de un símbolo con la información, o cantidad de 
información que lleva. 

Así, según este uso del término, las señales pueden tener un signifi- 
cado, pero llevan información. La información que lleva una señal es lo 
que nos puede «decir», lo que nos puede decir con verdad, sobre otro es- 
tado de cosas. En general, la información nos puede proporcionar conoci- 
miento y la información que lleva es lo que podemos saber gracias a ella. 
Si todo lo que yo le digo a alguien es falso, no le he dado ninguna infor- 
mación. O, por lo menos, no le he dado ninguna información del tipo que 
pretendía estar dando. Si (por otras razones) esa persona sabe que lo que 
digo es falso, lo que estoy diciendo le proporcionará información de todos 
modos, informará sobre mí (estoy mintiendo), pero no obtendrá la infor- 
mación que corresponde al significado convencional de lo que digo. 
Cuando digo «tengo dolor de muelas», lo que digo significa que tengo do- 
lor de muelas tanto si lo que digo es cierto como si es falso. Pero, cuando 
es falso, no lleva la información de que tengo dolor de muelas, porque no 
puede llevar al conocimiento de que tengo dolor de muelas. Nadie puede 
saber que tengo dolor de muelas cuando no lo tengo. Esa es la razón por la 
cual la declaración de mi compañero en la mesa de bridge me comunicó a 
mí, y no a nuestros adversarios, la información de que no tenía ningún as. 

Este es el sentido, o uso, que el término «información» tiene en muchos 
y muy diversos contextos. Decimos que un folleto contiene información 
sobre cómo legalizar un testamento. Lo decimos porque creemos que al- 
guien (convenientemente dotado) podría enterarse de algo referente a la 
legalización de un testamento consultando el folleto. Las oficinas de infor- 
mación no son solamente lugares donde se paga a los empleados para que 
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emitan sonidos con significado. Lo que las convierte en oficinas de infor- 
mación es que sus empleados saben, o pueden averiguar rápidamente, co- 
sas que interesan al usuario medio. Se puede enterar de algo preguntando 
en esos lugares. 

Cuando un científico nos dice que podemos usar la pupila del ojo como 
fuente de información acerca de los sentimientos o actitudes de otra per- 
sona, que un trueno (sonido) contiene información .obre el relámpago, que 
la danza de una abeja contiene información respecto al lugar donde se halla 
el néctar, o que la luz de una estrella lleva información sobre la constitu- 
ción química de la misma, se está refiriendo claramente a la información 
como algo que puede proporcionar conocimiento. Un estado de cosas con- 
tiene información sobre X en la medida en que un observador convenien- 
temente situado pueda enterarse de algo acerca de X consultándolo. Este 
es exactamente el sentido en que decimos que los libros, los periódicos y 
los expertos contienen, o tienen, información sobre un determinado tema. 
Me referiré a él como el sentido nuclear del término «información». 

En este sentido del término, la información falsa y la información 
inexacta no son tipos de información, del mismo modo que los patos de 
reclamo y los patos de goma no son tipos de patos. Y, así, decir que una 
determinada información es segura es una redundancia. Por supuesto, soy 
consciente de que, coloquialmente, decimos que la información que al- 
guien nos da es poco segura, o hablamos de proporcionar al espía infor- 
mación falsa, y decimos que alguien está mal informado, de manera que 
parece que está informado (sólo que incorrectamente). No pretendo en 
modo alguno regular el uso común. Estoy absolutamente dispuesto a ad- 
mitir que hay usos del término «información» que no se corresponden con 
lo que yo he denominado su uso nuclear. No obstante, si consultamos un 
diccionario, lo encontramos generalmente descrito en términos de «inteli- 
gencia», «noticias», «instrucción» y «conocimiento». Estos términos son 
sugerentes, tienen un núcleo común: todos señalan en la misma dirección, 
la de la verdad. La información es la que puede proporcionar conocimiento 
y, dado que la verdad es necesaria para el conocimiento, también lo es para 
la información. 

Así, a pesar de los caprichos del uso corriente, creo que es justo decir 
que el concepto nuclear antes descrito es a menudo lo que queremos ex- 
presar cuando hablamos de información. Después de todo, la información 
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es valiosa. Gastamos miles de millones de dólares en recogerla, almace- 
narla y recuperarla una vez almacenada. Se tortura a la gente para obte- 
nerla. Miles de vidas dependen de si el enemigo la tiene o no. Después de 
todo esto, sería realmente asombroso que la información no tuviera nada 
que ver con la verdad. 

Como hemos visto, algunos expertos han rechazado la relevancia se- 
mántica de la teoría de la comunicación y, en consecuencia, el que esta 
teoría pueda decirnos nada importante sobre la información tal como ésta 
se entiende normalmente. Parecen haberlo hecho basándose en un tipo de 
razonamiento como el que sigue: la información es un concepto semántico, 
la semántica es el estudio del significado. La teoría de la comunicación no 
proporciona una explicación satisfactoria del significado. Por tanto, la teo- 
ría de la información no proporciona una explicación satisfactoria de la 
información. El error de esta línea de argumentación radica en la suposi- 
ción de que el significado es el único concepto semánticamente pertinente, 
y de que si una teoría no proporciona una explicación satisfactoria del sig- 
nificado, no proporciona una explicación satisfactoria de ningún concepto 
semántico. 

Todavía no he justificado que la teoría de la comunicación nos dice 
algo sobre la información. Es lo que voy a hacer en lo que queda del pre- 
sente capítulo. Lo que he intentado mostrar en esta breve sección es que el 
sentido corriente, semánticamente relevante, de información (el sentido 
nuclear antes descrito) es algo distinto del concepto de significado. Por 
tanto, espero haber mostrado que el hecho de que la teoría de la informa- 
ción no nos diga qué es el significado no debe poner en duda que esta teoría 
pueda decirnos algo sobre la información. El que la teoría de la informa- 
ción pueda proporcionar una explicación suficiente de la información, en 
el sentido semánticamente relevante del término, depende de si puede pro- 
porcionar una explicación reveladora de esto que puede proporcionarnos 
conocimiento. 

Por supuesto, tiene que quedar claro desde el principio que la teoría de 
la comunicación no está pensada para decirnos qué significa la palabra 
«información». La teoría no aspira a entrar en el Diccionario de Webster. 
Ya he intentado decir de una manera tosca lo que el término «información» 
significa. Por lo menos he intentado aislar un «concepto nuclear» que es, 
creo, el que expresamos más a menudo mediante él. Lo que se debe esperar 
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de la teoría de la información es lo que se espera de cualquier teoría cien- 
tífica: una descripción más o menos completa, precisa y sistemática de las 
entidades y procesos subyacentes a los fenómenos que nos ocupan. Del 
mismo modo que la física nos dice qué son los relámpagos sin decirnos 
qué significa «relámpago» (aunque la palabra pueda pasar a significar lo 
que el físico nos dice sobre su referencia), la teoría de la información de- 
berá ser capaz de decirnos qué es la información sin tener que decirnos 
necesariamente qué significa la palabra «información». Como hablantes 
competentes del lenguaje, ya sabemos lo suficiente sobre el significado del 
nombre como para hacer que la pregunta «¿Qué es?» tenga sentido y se 
pueda responder. La información es algo que, dado el destinatario ade- 
cuado, puede proporcionar conocimiento. Lo que podemos llegar a saber 
tanto en términos de contenido como de cantidad, está limitado por la in- 
formación disponible. Además, la información se puede transmitir, recibir, 
intercambiar, almacenar, perder, recuperar, comprar V vender. Es ése el 
tipo de cosa al que nos referimos cuando hablamos de la información, en 
términos de lo que ésta puede hacer, y de lo que se puede hacer con ella. 
Lo que le pedimos a la teoría de la información es que nos diga, exacta- 
mente, qué es. 


La medida adecuada de la información 


Uno de los aspectos más claros en que la teoría de la comunicación no 
está preparada (no digo dotada) para tratar las cuestiones semánticas es 
que el significado, la verdad, la referencia y otras nociones semánticas aso- 
ciadas se refieren a mensajes o actos de comunicación individuales, mien- 
tras que la teoría se ocupa de cantidades medias de información (entropía). 
Como señala Kenneth Sayre, «La diferencia que al respecto existe entre la 
teoría de la información y la semántica es la misma que entre el estudio de 
las condiciones para la comunicación de cualquier mensaje y el estudio del 
contenido de mensajes individuales. »** 

En la medida en que nos ocupemos del contenido informativo de una 
señal o mensaje, de aquello de lo que podemos enterarnos «iradas a esa 





38 «Philosophy and Cybernetics», en Philosophy and Cybernetics, Kenneth Sayre y Frede- 
rick J. Crosson (eds.), Nueva York, 1967, pág. 11. 
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señal o mensaje (frente al de cuánto podemos enterarnos), no tiene sentido 
hablar de información media. Si se puede medir la cantidad de información 
asociada con un mensaje en particular, entonces podemos preguntarnos 
razonablemente por la cantidad media de información asociada con dos o 
más mensajes. Por ejemplo, si alguien le dice a Herman, mientras éste está 
leyendo en el periódico que sus acciones han bajado, que su esposa le es- 
pera abajo, podemos suponer que existe una media de la cantidad de infor- 
mación que ha recibido. Pero, desde luego, no tiene ningún sentido pre- 
guntarse por el contenido medio de los dos mensajes, Herman se ha ente- 
rado de dos cosas: de que han bajado sus acciones y de que su esposa le 
está esperando. No existe promedio alguno de lo que Herman se ha ente- 
rado, aunque sí pueda haberlo de cuánto se ha enterado. El contenido de 
un mensaje no es una cantidad de la que se pueda hacer la media, de lo 
único que podemos hacerla es de la cantidad de contenido. 

Por tanto, si la teoría de la información no ha de decir algo del conte- 
nido informacional de las señales, tiene que renunciar a ocuparse de pro- 
medios y decirnos algo sobre la información que está contenida en mensa- 
jes y señales individuales, puesto que sólo los mensajes y señales indivi- 
duales tienen contenido. 

Supongamos que en s hay 64 posibilidades y que quedan reducidas a 
una que llamaremos s2. Podemos imaginar que s es un tablero de ajedrez 
sobre el que ponemos aleatoriamente una ficha. Se asigna un número a 
cada una de las 64 casillas. La ficha cae en la casilla 2. Dado que las 64 
posibilidades han quedado reducidas a una, hay seis bits de información 
asociada con este suceso: /(s,) = seis bits. Supongamos, además, que que- 
remos comunicar esta información a algún lejano receptor r. El único canal 
disponible para la transmisión de esta información está muy restringido. 
Sólo se puede transmitir un dígito binario (O o 1), tarda un segundo entero 
en transmitir un dígito binario y el canal sólo está abierto durante un se- 
gundo. Obviamente, sólo se puede transmitir un dígito binario. ¿Cuánta 
información sobre la situación de la ficha podemos transmitir? 

Podría parecer que a través de este canal sólo se puede transmitir un bit 
de información, pero eso es incorrecto. La verdad es que sólo se puede 
transmitir un promedio de un bit de información. Puedo, en una determi- 
nada ocasión (con tal que tenga el código adecuado), llegar a transmitir 
mucho más de un bit de información con un único dígito binario. Por ejem- 
plo, podemos haber acordado de antemano que transmitiré un 1 si (y sólo 
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si) la ficha está en la casilla 2, y un O si la ficha está en alguna de las 63 
restantes. Cuando ocurre s2 (una feliz casualidad) y transmito un 1, se 
transmiten seis bits de información sobre la situación de la ficha. Esta señal 
lleva seis bits de información de s a r, como verificarán las fórmulas (1.5) 


y (1.8): 
(1.5) Is(r) = I(s) —- equivocidad 


Dado que nos ocupamos de la cantidad de información que lleva una 
determinada señal (el 1), tenemos que restar la equivocidad asociada a esta 
señal de la cantidad /(s) (que, en este caso, es seis bits). Dado que el 
acuerdo es que se transmitirá un 1 sólo si la ficha está en la casilla 2, y 
suponiendo que sólo se recibirá un 1 si se transmite un 1, las posibilidades 
condicionales que definen la equivocidad (1.8) son todas O o 1. Por tanto, 
E=0. No hay equivocidad asociada a la recepción de un 1 en el receptor. 
Así, según la fórmula (1.5), podemos concluir que la cantidad de informa- 
ción transmitida por este dígito es igual a seis bits: 


Ld) =6-0 
= 6 bits 


Por supuesto, no puedo sacar por término medio este índice de trans- 
misión, ya que ocurrirá con más frecuencia alguna de las otras posibilida- 
des (la ficha no caerá en la casilla 2). Cuando la ficha está en alguna de las 
otras 63 casillas tengo que transmitir un O. En ese caso, sólo consigo trans- 
mitir una cantidad fraccionaria de información. La cantidad de equivoci- 
dad asociada con la recepción en r de un O es muy grande. Usando de 
nuevo la fórmula (1.8), tenemos que £(0) = 5,95 bits (aproximadamente). 
Por tanto, la llegada de un 0 al receptor sólo lleva unos 0,05 bits de infor- 
mación sobre la situación de la ficha. Con este código, sólo podemos ob- 
tener un promedio de unos 0,095 bits de información por mensaje [fórmu- 
las (1.9) y (1.5)]. 

Así pues, por término medio, codificando la información de este modo, 
sólo conseguiré transmitir alrededor de 0,095 bits de información con cada 
mensaje. Es muy ineficaz. Para maximizar la cantidad media de informa- 
ción que transmitía con cada símbolo, hubiera tenido que elegir otro có- 
digo. Pero si, por ejemplo, hubiera transmitido un 1 cuando la ficha estu- 
viera en una casilla blanca y un O cuando estuviera en una casilla negra, 
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entonces cada transmisión hubiera llevado un bit de información (redu- 
ciendo 64 a 32 las posibilidades de s) y el índice de transmisión hubiera 
sido un bit. 

Como hemos subrayado repetidamente, en la mayor parte de las apli- 
caciones de la teoría de la información, la cantidad importante es la canti- 
dad media de información generada en una fuente y la cantidad media de 
información transmitida acerca de esa fuente. El interés de los ingenieros 
radica en diseñar el código más eficiente de cara a maximizar el índice de 
comunicación. De las dos maneras de codificar la información sobre la 
situación de la ficha, el ingeniero de telecomunicaciones preferiría obvia- 
mente la segunda. A la larga, se comunicará mucha más información co- 
dificándola de esta forma que de la otra. No obstante, al maximizar el pro- 
medio renunciamos a la posibilidad de que la señal transmitida nos diga 
exactamente dónde está la ficha. Codificando del primer modo transmitía- 
mos muy raramente seis bits de información (1/64 de la veces), pero esta 
señal individual lleva toda la información asociada al hecho de que la ficha 
esté en la casilla 2. Casi nunca le damos a la bola, pero cuando lo conse- 
guimos nos anotamos un tanto. Si adoptamos el segundo procedimiento de 
codificación y transmitimos un 1 cuando la ficha está en una casilla blanca 
y un O cuando está en una casilla negra, transmitimos consiguientemente 
un bit de información, pero ninguna señal lleva seis bits de información. 
Por tanto, ninguna señal podrá decirle exactamente a su receptor dónde 
está la ficha. Para quien esté interesado en averiguar exactamente dónde 
está la ficha es preferible codificar del primer modo. No dice a menudo lo 
que se quiere saber, pero por lo menos lo dice a veces. Adoptar la otra 
estrategia, la más eficaz desde el punto de vista del ingeniero, supone re- 
nunciar a la posibilidad de enterarse mediante alguna señal de dónde exac- 
tamente se halla la ficha. Para averiguar exactamente dónde está la ficha 
(es decir, en qué casilla), hay que abandonar el sistema de codificación 
ideal del ingeniero y adoptar un sistema mucho menos eficaz. 

Otra ilustración de lo mismo sería el juego de las Veinte Preguntas. 
Normalmente uno puede hacer veinte preguntas (a las que se pueda res- 
ponder mediante «sí» o «no») para descubrir en qué está pensando el com- 
pañero de juego. Normalmente se piensan las preguntas tendiendo a maxi- 
mizar la cantidad de información proporcionada por cada respuesta de «sí» 
o «no». Con cada pregunta se intente reducir a la mitad las posibilidades 
que quedan. Según la teoría de la comunicación, ésta es la estrategia más 
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eficaz, puesto que, por término medio, se obtendrá la mayor cantidad de 
información procediendo de este modo. Supongamos, no obstante, que 
cambiamos un poco el juego y no permitimos hacer más que una pregunta. 
Se impone cambiar de estrategia. Ya no conviene empezar con preguntas 
como «¿Es mayor que una caja de pan?», puesto que así no podemos ganar. 
Se nos acabarían las preguntas antes de llegar a la pregunta clave, por 
ejemplo, «¿Es este lápiz?». En este juego así modificado hay que «disparar 
a ciegas» y empezar preguntando el único tipo de preguntas que pueden 
hacernos ganar: «¿Es este lápiz?» «¿Es mi gato?» La cantidad media de 
información que se obtiene de las respuestas a estas preguntas será muy 
baja (puesto que las respuestas serán casi siempre «no»), pero existe la 
posibilidad de obtener una respuesta afirmativa, y, cuando se recibe, se ha 
conseguido reducir a una sola un número indefinidamente grande de posi- 
bilidades con una única y afortunada pregunta. La respuesta «sí» lleva una 
gran cantidad de información, la suficiente para hacernos ganar en este 
proceso de aprendizaje. 

Todos los teoremas interesantes de la teoría de la comunicación depen- 
den de la concepción de la «información» como información inedia. Por 
ejemplo, el teorema fundamental de Shannon”? se expresa en términos de 
la capacidad que tiene un canal para transmitir información. No obstante, 
hay que tener en cuenta que este teorema sólo se ocupa de las limitaciones 
de un canal para alcanzar un determinado índice medio de transmisión. La 
capacidad de canal es, por esta razón, una magnitud importante en el estu- 
dio de sistemas de comunicación. Pero, por la misma razón, es muy poco 
pertinente para la aplicación de la teoría de la información al estudio de la 
información tal como ésta se entiende normalmente. Ello se debe a que, 





39 The Mathematical Theory of Communication, pág. 59. Cuando C es la capacidad del 
canal (en bits por segundo) y H es la cantidad de información que se genera en la fuente (en 
bits por segundo), este teorema dice que diseñando procedimientos de codificación adecua- 
dos se puede transmitir símbolos a través del canal a una velocidad media que es de casi C/H, 
pero que, por muy inteligente que sea la codificación, nunca puede sobrepasar C/H. Para 
decirlo todavía menos técnicamente, cuando la velocidad a la que se genera la información 
es menor que la capacidad del canal, es posible codificarla de tal manera que llegará al re- 
ceptor con una fidelidad arbitrariamente alta. Esta expresión «informal» del teorema se puede 
ver en J. L. Massey, «Information, Machines and Men», pág. 50, en Philosophy and Cyber- 
netics. 


== 
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como hemos visto, la información depende de lo que, y de cuánto, pode- 
mos enterarnos a partir de una determinada señal, y sencillamente no hay 
ningún límite alo que se puede saber gracias a una determinada señal sobre 
otro estado de cosas. Como muestra el ejemplo de la ficha, con una señal 
podemos enterarnos de dónde está exactamente, incluso cuando la canti- 
dad de información asociada con la posición de la ficha es seis bits y la 
«capacidad» del canal para transmitir información es un bit. La capacidad 
del canal (tal como ésta se entiende en teoría de la comunicación) no re- 
presenta ningún límite para lo que uno puede llegar a saber a través de un 
canal (mediante una determinada señal) y, por tanto, no representa ningún 
límite para la cantidad de información (en el sentido corriente del término) 
que puede ser transmitida.* 





40 A menos que se recuerden los divergentes intereses de los teóricos de la comunicación, 
algunas de sus afirmaciones parecerán extravagantes o absurdas. Por ejemplo, en muchas 
exposiciones de la teoría de la información se encuentran cálculos de cuánta información 
contiene un texto del inglés. Estos cálculos se realizan en términos de 27 posibilidades (26 
letras y el espacio). Contando con las diferentes posibilidades de cada letra (es decir, la ¡ es 
más probable que la x) y el alto grado de redundancia (una sucesión de letras reduce las 
posibilidades, y cambia las probabilidades, de la próxima letra), se estima que cada letra que 
se escribe en un texto inglés tiene una medida informacional por término medio de aproxi- 
madamente un bit. Por tanto, cada palabra de cinco letras tiene una medida informacional 
media de cinco bits. Véase la estimación original de Shannon (dos bits por símbolo) en The 
Mathematical Theory of Communication, pág. 56, y su estimación más baja (un bit por sím- 
bolo) en «Prediction and Entropy of Printed English», Bell System Technical Journal, vol. 
30 (1951), págs. 50-64. Para una exposición no técnica, véase J. R. Pierce, Symbols, Signáis 
and Noise, Nueva York, 1961, capítulo 5. 

Hay dos aspectos respecto a los cuales estas situaciones no son pertinentes para la informa- 
ción tal como ésta se entiende normalmente: 1) se ocupan de promedios; y 2) se ocupan, no 
de la información que la proferencia de una oración lleva sobre alguna otra situación, sino de 
la información generada por la aparición de esa determinada secuencia de letras en una pá- 
gina. En términos de nuestro ejemplo original, la nota que contenía el nombre «Herman» 
llevaría (según el teórico de la comunicación) aproximadamente seis bits de información 
(puesto que estaba compuesta de seis letras). Esta estimación se hace, obviamente, sin tener 
en cuenta para nada lo que normalmente consideramos la información que lleva el que ese 
nombre esté en la nota. En nuestro ejemplo original, la aparición del nombre «Herman» en 
la nota llevaba tres bits de información sobre qué empleado fue seleccionado. Desde un punto 
de vista corriente, ésa es la cantidad que importa. El interés del ingeniero en la información 
generada por una secuencia de letras tan sólo ha inspirado la opinión (de carácter derogato- 
rio) de que la teoría de la comunicación sólo se ocupa de la auténtica información en un 
sentido sintáctico. 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


Así, si queremos una medida adecuada para la información, tenemos 
que ocuparnos de la cantidad de información contenida en señales indivi- 
duales. La teoría de la comunicación puede ser explotada para obtener una 
medida de esa cantidad. De hecho, ya he usado esta teoría para (contra lo 
que ella pretende) calcular la cantidad de información asociada con señales 
individuales. Con respecto a la situación de la ficha, se decía que un 1 
llevaba seis bits de información sobre la ficha. Un O llevaba sólo una frac- 
ción de un bit. Estas medidas pueden considerarse las medidas de la teoría 
de la información para la cantidad de información que llevan esas señales 
individuales. El valor de sorpresa de un determinado suceso, /(s»), y la 
cantidad de información que lleva una determinada señal [por ejemplo, 
1s(1)] no son cantidades significativas en las aplicaciones de la teoría de la 
información en ingeniería (excepto, tal vez, como intermediarios matemá- 
ticos para calcular la entropía), estas cantidades son las que importan de 
cara al estudio de la información, tal como ésta se concibe normalmente y, 
por tanto, para el tipo de estudios cognitivos que dependen de un concepto 
semánticamente relacionado de información. 

Las cantidades que nos interesan son, pues, la cantidad de información 
generada por un determinado estado de cosas sa: 


Q.1) I(sa) = log 1/p(sa) 
y la cantidad de información que una determinada señal r, lleva sobre sa: 
(2.2) Ís(ra) = Ksa) — Elva) 


donde K(r,) es la equivocidad asociada a la señal r, [definida según (1.8) 
del capítulo 1], a la que en adelante nos referiremos simplemente como la 
equivocidad de la señal r.. 

Es necesario subrayar (aunque sólo sea en honor de quienes me acusa- 
ron de malinterpretar o comprender mal la teoría de la comunicación) que 
ahora estamos dando a las fórmulas mencionadas una interpretación que 
no es la que tienen en las aplicaciones habituales de la teoría de la comu- 
nicación. Las estamos usando para definir la cantidad de información aso- 
ciada con eventos y señales individuales. Tal interpretación es extraña 
(pero, yo diría, perfectamente compatible con los usos ortodoxos de estas 
fórmulas). En las aplicaciones habituales de la teoría de la comunicación 
el interés se centra en la fuente de información y en el canal por donde se 
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transmite esa información, y para describir esos aspectos de la comunica- 
ción no hay por qué interesarse por los mensajes individuales que se trans- 
miten. Pero nosotros nos ocupamos de los mensajes individuales, del con- 
tenido individual, la información, que se transmite desde una fuente a tra- 
vés de un canal y yo sugeriría que las fórmulas (2.1) y (2.2) contienen la 
clave para entenderla. 


Restricciones comunicativas en el flujo de la información 


Podría parecer que (2.1) y (2.2) no son unos instrumentos demasiado 
útiles. Aparte de los ejemplos artificiales referentes a juegos (o en aplica- 
ciones a sistemas de telecomunicaciones en los que hay una gama teórica- 
mente restringida de posibilidades con sus probabilidades asociadas) pa- 
rece inútil usar esas fórmulas. ¿Cómo podemos calcular, por ejemplo, la 
cantidad de información que genera el que Edith esté jugando al tenis? ¿Y 
cuánta información sobre las actividades de Edith hay en la luz que llega 
hasta Herman, un espectador casual? 

Para responder a este tipo de cuestiones según las fórmulas (2.1) y (2.2) 
hay que conocer: 1) las posibilidades alternativas (por ejemplo: que Edith 
esté comiendo, que Edith se esté duchando); 2) las probabilidades asocia- 
das a todas esas posibilidades alternativas, y 3) las probabilidades condi- 
cionales (dada la configuración de los fotones que llegan a los receptores 
visuales de Herman) de cada una de esas posibilidades alternativas. Ob- 
viamente, en la mayoría de los escenarios de comunicación normales no 
conocemos ninguna de las tres cosas. Ni siquiera está muy claro que pu- 
diéramos conocerlas. ¿Cuáles son, después de todo, las posibilidades al- 
ternativas a que Edith esté jugando al tenis? Probablemente habrá cosas 
posibles (como que Edith vaya a la peluquería, en lugar de jugar al tenis) 
y otras que no lo son (que Edith se convierta en una pelota de tenis), pero, 
¿cómo empezar a catalogar esas posibilidades? Si Edith pudiera estar ha- 
ciendo footing, ¿hay que contarlo como una posibilidad alternativa? ¿O 
bien debemos contarlo como más de una, dado que podría estar corriendo, 
casi en cualquier parte, a velocidades muy distintas, y en casi cualquier 
dirección? 

Estas dificultades para la aplicación de (2.1) y (2.2) a situaciones con- 
cretas (situaciones que puedan interesar a alguien que, como yo, intenta 


== 
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formular una teoría del conocimiento) pueden parecer enormes, pero, 
como veremos, sólo suponen un obstáculo para un uso demasiado ambi- 
cioso de las mismas. Si se busca una medida absoluta, una cifra determi- 
nada, para la cantidad de información que genera un evento o lleva una 
señal, se debe poder determinar cuál es la gama de posibilidades y sus 
probabilidades asociadas. En algunas aplicaciones de la teoría de la comu- 
nicación a la ingeniería se dan estas condiciones.*! Pero en la mayoría de 
las situaciones corrientes en las que se transmite información sólo pode- 
mos hacer toscas conjeturas acerca de la cantidad de información que se 
genera y transmite. Tal vez no haya respuesta a la pregunta: ¿Cuánta in- 
formación se está transmitiendo? Tal vez no haya respuesta a esa pregunta 
porque tal vez no haya una gama bien definida de posibilidades alternati- 
vas en términos de la que poder calcular este número. 

A pesar de esas limitaciones, las fórmulas (2.1) y (.2) tienen un uso 
importante. Se pueden usar para establecer comparaciones, en particular, 
comparaciones entre la cantidad de información generada por la ocurren- 
cia de un evento y la cantidad de información sobre este evento que lleva 
una determinada señal. Tales comparaciones se pueden establecer sin de- 
terminar en ningún momento cuáles son los valores absolutos de la mag- 
nitud. Es decir, se pueden usar estas fórmulas del mismo modo que se usa- 
ría un trozo de cuerda en la que no están marcadas las pulgadas ni los pies. 
Se puede usar la cuerda para averiguar si A es mayor que B sin determinar 
la longitud de A ni de B. 

Por ejemplo, si yo le digo al lector que Denny vive en la calle Adams 
en Madison, Wisconsin, le estoy dando más información que si solamente 
le digo que vive en Madison, Wisconsin. Para usar (2.2) para corroborar 
este juicio intuitivo no es necesario saber en cuántos sitios distintos puede 
vivir Denny, ni siquiera en cuántos sitios puede vivir Denny en Madison, 
Wisconsin. Lo único que hay que saber es que el número de lugares donde 
se puede vivir en Madison, Wisconsin, es mayor que el número de lugares 





41 Por lo menos hay una razonable aproximación a las condiciones que rigen la aplicación 
de la teoría. En telecomunicaciones se trata (o, por lo menos, se da por supuesto que se está 
tratando) con procesos estocásticos; por ejemplo, que son ergódicos o «estadísticamente ho- 
mogéneos». Se consideran «posibles» los eventos que suceden con una cierta frecuencia (por 
pequeña que ésta sea) en los procesos que se considera. Se encontrará una exposición de las 
restricciones de la aplicación de la teoría de Shannon, The Mathematical Theory of Commu- 
nication, págs. 45-56. 
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donde se puede vivir en la calle Adams de Madison, Wisconsin. Si esto es 
así, y no veo como podría no serlo (sabiendo lo que sé sobre Madison), 
entonces la equivocidad asociada con el primer mensaje es menor que la 
equivocidad asociada con el segundo. Por tanto, la fórmula (2.2) nos dice 
que el primer mensaje lleva más información acerca de dónde vive Denny 
que el segundo. 

O bien consideremos otro posible uso de la fórmula (2.2), un uso cuya 
importancia es crucial para nuestra (eventual) definición del contenido in- 
formacional de una señal. Lo que queremos saber no es cuánta informa- 
ción se genera mediante la ocurrencia de s., ni cuánta información lleva r. 
sobre la ocurrencia de ese evento, sino si ra lleva tanta información sobre 
Sa COmo se genera mediante su ocurrencia. Para responder a esta pregunta 
no es necesario conocer el valor de (sa) ni de /x(ra). El examen de la fór- 
mula (2.2) muestra que lo único que hay que saber es si la equivocidad es 
cero o no lo es. Si la equivocidad E(r,) es O, entonces la señal lleva tanta 
información sobre la fuente como se genera en ésta mediante la ocurrencia 
de Sa. Si, por otra parte, la equivocidad es positiva, la señal lleva menos 
información de la que está asociada con la ocurrencia de sq. 

Este uso comparativo de la fórmula (2.2) es el único uso esencial al que 
se aplicará a lo largo de este ensayo. La aplicación epistemológica de la 
teoría de la comunicación y, el uso de esta teoría pura desarrollar una ex- 
plicación del contenido informacional de una señal (el mensaje que lleva), 
no exige que sepamos si un sujeto ha recibido 20, 200 o 2.000 bits de in- 
formación. Lo único que exige (cuantitativamente hablando) es que el su- 
jeto reciba tanta información como se genera mediante el estado de cosas 
que el sujeto sabe que existe. Los valores absolutos de /(sa) e [x(r,) no son 
pertinentes para una correcta resolución de estas cuestiones. Lo que que- 
remos saber es si /s(r,) es menor o igual que /(sa). 

No obstante, nunca se insistirá demasiado en que se pretende que las 
probabilidades condicionales que definen la equivocidad que hay entre 
fuente y receptor sean características objetivas del sistema de comunica- 
ción. Tal vez no sepamos cuáles son esas probabilidades condicionales, tal 
vez no podamos determinar cuáles son, pero eso no tiene ninguna reper- 
cusión en el valor real de la equivocidad y por tanto tampoco en si la señal 
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lleva tanta información como genera la fuente. Nuestro anterior ejemplo 
nos ayudará a aclarar este punto. Cuando los empleados acordaron poner 
el nombre de Herman en su nota para el jefe si resultaba seleccionada Shir- 
ley, decíamos que la nota sólo llevaba dos bits de información sobre el 
resultado del proceso de selección. La nota reducía el número de posibili- 
dades de ocho a dos (Herman o Shirley). Por supuesto, el jefe creía que la 
nota era inequívoca. En términos de la teoría de la información, el feje 
creía que la nota llevaba tres bits de información. Simplemente, estaba 
equivocado. La cantidad de información que lleva un mensaje no depende 
de la cantidad de información que el receptor cree que lleva. Sólo depende 
de las posibilidades que de hecho existen en s y de las probabilidades con- 
dicionales de esas varias posibilidades una vez que se ha recibido el men- 
saje. En otro ejemplo el mensajero perdía la nota y escribía otra que con- 
tenía el nombre «Herman». Decíamos entonces que esa nota no llevaba 
información alguna sobre la decisión de los empleados. Una vez más, el 
valor de /s(r.,) es independiente de lo que el receptor de r, crea acerca del 
contenido informacional de 74. 

Más adelante, y de acuerdo con muchos modelos de la percepción hu- 
mana basados en el procesamiento de información, imaginaremos que los 
sistemas sensoriales de un organismo son como canales de recepción de 
información sobre su medio exterior. En su momento tendremos que 
afrontar el tema del escepticismo. Pero no debemos permitir que las cues- 
tiones escépticas irrumpan antes de tiempo. No son pertinentes para esta- 
blecer qué o cuánta información se ha recibido. Ni siquiera si, siguiendo a 





2 Eso no significa que niegue que en algunas situaciones experimentales puede ser más 
conveniente definir la información en términos de lo que el sujeto cree sobre el número de 
posibles estímulos diferentes y sus estimaciones de sus respectivas probabilidades relativas. 
Harold W. Hake describe dos formas de medir la información: «Sin embargo, cuando el re- 
ceptor de un mensaje es el observador humano, tenemos que tener en cuenta dos dominios 
de medida de la información. En primer lugar, la medida basada en la probabilidad real de 
ocurrencia del mensaje. En segundo lugar, la medida de la información que se basa en las 
ideas subjetivas del receptor acerca de la probabilidad de ocurrencia de cada uno de los men- 
sajes del conjunto». «The Perception of Frequency of Occurrence and the Development of 
“Expectancy” in Human Esperimental Subject», en Information Theory in Psychology: Pro- 
blems and Methods, Henry Quastler (ed.), Free Press, Glencoe, 111., 1955, pág. 19. 

Aunque relativizaremos (en el capítulo 3) la información a lo que el sujeto ya sabe sobre 
las distintas posibilidades de la fuente, el conjunto de probabilidades condicionales que defi- 
nen la equivocidad son independientes de lo que el sujeto sabe o cree de ellas. 


== 
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Hume, consideramos que el organismo está atrapado en el círculo de sus 
propias percepciones, podemos concluir que estas percepciones están des- 
provistas de información. Ni siquiera si estamos de acuerdo con Hume, en 
que: 


«Nunca se presenta a la mente nada que no sea sus propias percepciones y en 
modo alguno puede [la mente] tener experiencia de la conexión de éstas con los 
objetos. El supuesto de que tal conexión existe carece, por tanto, de cualquier fun- 
damento racional.»* 


Podemos concluir, como parece hacerlo F. J. Crosson, que según la 
teoría de Hume no podemos considerar que los sentidos son canales de 
información, porque «no tenemos acceso independiente a los datos intro- 
ducidos y a sus probabilidades y, por lo tanto, tampoco probabilidades 
condicionales».** Lo máximo que se puede deducir de la teoría de Hume 
es que nunca podemos determinar cuáles son las probabilidades condicio- 
nales; por lo tanto, nunca podremos determinar si nuestras percepciones 
contienen de hecho información sobre nuestro entorno. Pero eso es perfec- 
tamente compatible con que la experiencia de nuestras percepciones esté 
llena de información acerca de nuestro entorno físico. Una señal prove- 
niente de una galaxia lejana y que se aleja rápidamente del Sistema Solar 
no está desprovista de información sólo porque seamos incapaces de de- 
terminar cuáles son las probabilidades condicionales y, por tanto, qué in- 
formación (o cuánta información) contiene la señal. La razón de que esto 
sea así es que la información contenida en la señal depende, no de las pro- 
babilidades condicionales que podamos verificar independientemente, 
sino de las probabilidades condicionales por sí mismas. 

La información que una señal contiene tampoco depende de que el re- 
ceptor se entere de algo mediante esa señal.* Tal vez el receptor no sea 





43 An Enquiry Concerning the Human Understanding (The Open Court Publishing Co., 
LaSalle, 111., 1955), Sección XII pág. 171. 


4 «Information Theory and Phenomenology», Philosophy and Cybernetics, pág. 121. 


4 No se puede usar el concepto de información en el análisis de conceptos epistémicos 
como conocimiento, reconocimiento y memoria si se usan y desvirtúan conceptos epistémi- 
cos (como aprender, identificar o interpretar correctamente) en el análisis de la información. 
Eso introduce un círculo vicioso en el programa. 

El temprano esfuerzo de Kenneth Sayre para aplicar la teoría de la información al análisis 
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capaz de descodificar o interpretar el mensaje. O bien cree que sabe des- 
codificarlo, pero lo hace mal. Si se me permite, usaré una vez más mi viejo 
ejemplo. Los empleados podrían haberse comunicado con su jefe mediante 
un código. Podrían haber acordado que escribirían el nombre «Herman» 
en la nota en caso de que Shirley resultase seleccionada, el nombre «Shir- 
ley» si se seleccionaba a Doris, el nombre «Doris» si era seleccionado 
Emil, y así sucesivamente. Cuando llega al despacho del jefe la nota con 
el nombre «Bárbara» (el nombre en clave de Herman), la nota contiene la 
misma cantidad de información sobre el resultado del proceso de selección 
que contenía cuando los empleados pasaban el código convencional 
(«Herman» para Herman).** Pero si el jefe no conoce el código, concluirá 
equivocadamente que fue elegida Bárbara, interpretará mal el mensaje. 
Sin embargo, esta mala interpretación no significa que la nota no especifi- 
case inequívocamente cuál era el candidato, no contuviera la información 
de quién fue seleccionado. Simplemente, hay que conocer el código para 
extraer esa información.*” 





del reconocimiento tiene este defecto (Recognition, capítulo 11). Al intentar distinguir el re- 
conocimiento de la percepción-sin-reconocimiento (por ejemplo, ver la letra W sin recono- 
cerla), Sayre afirma que el reconocimiento requiere que el sujeto adquiera información sobre 
la entidad percibida. Eso parece plausible. Sería incluso ilustrativo si hubiera alguna especi- 
ficación independiente de qué es la información. Pero, aunque usa los recursos técnicos de la 
teoría de la información (sugiriendo así que está usando el concepto de la teoría de la infor- 
mación), Sayre trivializa su tesis al insistir en que la cantidad de información contenida en 
una señal depende de la correcta identificación O interpretación de esa señal por parte del 
receptor (págs. 240-241). Eso no sólo convierte a la información en algo que las radios no 
reciben, sino que además transforma la tesis de que el reconocimiento supone una adquisición 
de información en la verdad obvia de que el reconocimiento exige una correcta identificación. 
Ésa no es una conclusión demasiado original, y desde luego no se necesita la teoría de la 
información para obtenerla. 


46 «Supongamos que en telegrafía representemos un punto mediante un impulso positivo y 
un guión mediante un impulso negativo. Supongamos que algún bromista cambia las cone- 
xiones de tal manera que cuando se transmita un impulso positivo se reciba un impulso ne- 
gativo y cuando se transmita un impulso negativo se reciba un impulso positivo. Como no se 
ha introducido incertidumbre (es decir, la equivocidad sigue siendo la misma), la teoría de la 
información dice que el índice de transmisión de información es el mismo que antes.» J. R. 
Pierce, Symbols, Signáis and Noise, pág. 274. 


47 Este punto tiene una importancia obvia para el problema del «espectro invertido» en 
filosofía de la percepción. Una persona para la que todas las cosas rojas son azules (y vice- 
versa) obtiene la misma información sobre el color de los objetos que los observadores nor- 
males. Lo único que sucede es que la información se codifica de una manera poco usual. En 
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Una vez pasados los preliminares podemos articular finalmente un 
principio sobre el flujo de la información, un principio que, junto con lo 
que ya sabemos sobre teoría de la comunicación, nos guiará en la formu- 
lación de una auténtica teoría semántica de la información en el próximo 
capítulo. 


Principio de la copia: Si A lleva la información de que B, y B lleva la informa- 
ción de que C, entonces A lleva la información de que C. 


Yo lo considero un principio regulativo, algo inherente y esencial al 
concepto común de información, algo que debiera preservar cualquier teo- 
ría de la información, ya que si se puede saber que B mediante A, y de B 
que C, entonces se debería poder saber que C mediante A (que, de hecho, 
se sepa o no, es otra cuestión). 

Le he dado a este principio un nombre que recuerda el ejemplo más 
claro del mismo. Las xerocopias de un folleto (que contiene la información 
de que C) llevan la misma información (a saber, que C) que el folleto ori- 
ginal, con tal de que sean copias exactas, con tal de que las copias lleven 
información exacta sobre las palabras, los diagramas y figuras del folleto 
original. No se pierde información al reproducir algo que contiene infor- 
mación (por lo menos, no se pierde si las reproducciones llevan informa- 
ción exacta acerca del vehículo original de la información). Eso es lo que 
dice el principio de la copia. Si un haz de fotones lleva la información de 
que la luz está encendida, y el hecho de que la luz esté encendida lleva la 
información de que el interruptor está cerrado, entonces el haz de fotones 
lleva la información de que el interruptor está cerrado. 

El principio de la copia es absolutamente fundamental para el flujo de 
la información. Las ondas acústicas que surgen de un locutor de radio lle- 
van información sobre lo que sucede en el estudio radiofónico porque lle- 
van información fiel sobre lo que ocurre en el circuito auditivo del recep- 
tor; estos eventos, a su vez, llevan información sobre la modulación de la 
señal electromagnética que llega a la antena; y eso lleva información sobre 
el modo en que está vibrando el diagrama del micrófono (que está en el 
estudio radiofónico). La conducta del micrófono lleva información sobre 





cambio, si se imagina que la inversión es congénita, el sujeto no experimentará mayor difi- 
cultad en «romper» este código (obteniendo así la información pertinente) de lo que lo hacen 
los observadores normales. 


=T6= 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


lo que está diciendo el locutor. Toda esta cadena de acontecimientos lleva 
información sobre su input gracias a repetidas aplicaciones del principio 
de la copia. El mismo principio se aplica a las comunicaciones orales que 
tienen lugar habitualmente. Recibo información sobre las actividades que 
alguien realizó el verano pasado, y así me entero de que esa persona visitó 
Italia en virtud de que (si esa persona no miente) sus preferencias llevan 
información sobre sus creencias y (si sabe de qué habla) sus creencias lle- 
van información sobre lo que hizo el verano pasado.* Sin el principio de 
la copia estas cadenas de comunicación nunca podrían unir los extremos. 

Así pues, voy a suponer, sin más argumentos, que cualquier explica- 
ción de la información que lleva una señal debe preservar la validez del 
principio de la copia. ¿Qué es lo que dice este principio sobre el contenido 
informativo de una señal? Dice que si una señal ha de llevar la información 
de que s es F (donde s se refiere a algo que pasa en la fuente), entonces la 
cantidad de información sobre s que lleva la señal tiene que ser igual a la 
cantidad de información generada por el hecho de que s sea F. Si el hecho 
de que s sea F' genera tres bits de información, entonces ninguna señal que 
lleve sólo dos bits de información sobre s puede en modo alguno llevar la 
información de que s es F. 

Supongamos, en contra de lo que se quiere mostrar, que una señal pu- 
diera llevar información cuando tiene una equivocidad positiva, que pu- 
diera llevar la información de que s es Fa pesar de llevar menos informa- 
ción de la que está asociada al hecho de que s sea F. Eso significaría que 
A podría llevar la información de B, y B la de C, a pesar de que existe una 
equivocidad positiva entre A y B y también entre B y C. Se pierde un poco 
de información en la transmisión de C a B (pero no la suficiente para im- 
pedir la transmisión de la información de que C), y un poco en la transmi- 
sión de B a A (pero no la suficiente para impedir la recepción en A de la 
información de que B). Se pueden sumar estas pérdidas.*” La cantidad de 





48 Este ejemplo no es más que la expresión de una cuestión epistemológica familiar: a saber, 
se puede saber que P mediante alguien que dice que P sólo si el que esa persona diga que P 
expresa lo que sabe (y no simplemente lo que cree sinceramente). Desde el punto de vista del 
principio de la copia, la exigencia de que el informante sepa que P no es más que la exigencia 
de que sus creencias lleven información sobre los temas de los que habla. Después volvere- 
mos sobre esto. 


42 A título de ejemplo de cómo las pérdidas se pueden acumular, supongamos que en las 
estaciones A, B y C hay ocho posibilidades, todas ellas igualmente probables. En C sucede c> 
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información sobre C que hay en A se puede reducir fácilmente a una can- 
tidad menos que la cantidad de información que en B hay sobre C. A me- 
dida que vamos añadiendo de este modo eslabones a esta cadena de comu- 
nicación, la cantidad de información sobre C va decreciendo progresiva- 
mente. Los eslabones distantes entre sí en esta cadena de comunicación no 
llevarán prácticamente ninguna información sobre C (una cantidad de in- 
formación tan cercana como queramos a cero), pero llevarán suficiente in- 
formación sobre el eslabón anterior para mantener intacto vi mensaje se- 
gún el principio de la copia. La teoría de la comunicación dice que los 
eslabones distantes entre sí en esta cadena llevarán cantidades cada vez 
más pequeñas de información sobre C (dado que las pequeñas equivocida- 
des que hay entre los eslabones adyacentes se acumulan hasta dar lugar a 
una gran cantidad de equivocidad entre los puntos extremos). Nuestro 
principio de la copia dice, por otra parte, que si cada eslabón de la cadena 
lleva la Información adecuada sobre su predecesor (A lleva la información 
de que B, B lleva la información de que C), entonces el último eslabón 
llevará la misma información sobre el primer eslabón (a saber, que C) que 
el segundo eslabón B. La única forma de conservar el principio de la copia 
ante la cantidad de información que desaparece es admitir que una señal 
puede llevar mensaje (por ejemplo, la información de que C) a pesar de 
que exista una enorme cantidad de equivocidad, a pesar de que no lleve 





y genera tres bits de información. Las probabilidades condicionales entre B y C son tales que 
la ocurrencia en B de b, aumenta la probabilidad de cz hasta 0,9 y reduce la probabilidad de 
cualquier otra posibilidad a 0,014. Calculando la equivocidad entre b y C de acuerdo con 
(1.8), tenemos que E(b») = 0,22 bits (aproximadamente). Por tanto, b, lleva aproximadamente 
2,78 bits de in formación sobre lo que sucedió en C. Supongamos, además, que el canal que 
une A con B es idéntico: sucede a, y aumenta la probabilidad de ba 0,9, reduciendo a 0,014 
la probabilidad de todas las demás posibilidades de B. Por tanto, a, lleva 2,78 bits de infor- 
mación sobre lo ocurrido en B No obstante, si calculamos la equivocidad entre A y C, descu- 
brimos que E(a), (= 1,3 bits (aproximadamente). az sólo lleva 1,7 bits de información sobre 
lo que sucedió en C. 

Si suponemos que se puede transmitir un mensaje de tres bits con equivocidad positiva 
(pongamos por caso una equivocidad menor que 0,25 bits), entonces llegamos al paradójico 
resultado de que b, nos dice lo que ocurrió en C (lleva la información de que sucedió c>), y 
a dice lo que su cedió en B (a saber, que ocurrió b,), pero az no puede decirnos qué ocurrió 
en C. Esto contradice el principio de la copia. Se puede construir una paradoja similar inde- 
pendientemente de cuán baja pongamos la equivocidad (con tal de que sea mayor de cero) 
que se puede tolerar en la transmisión del contenido informativo (el mensaje). 
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más que una cantidad insignificante de información sobre la fuente. Pero 
eso es absurdo. 

Es absurdo porque eso supone que para transmitir un mensaje no se 
necesita ningún grado de correlación, ninguna cantidad de dependencia, 
entre fuente y receptor. Cualquier correlación (excepto la completa alea- 
toriedad) entre fuente y receptor sirve para la comunicación del contenido. 
Como hemos visto, una señal lleva alguna información sobre s si existe 
algún grado de dependencia entre ella y lo que sucede en s, sí altera (aun- 
que sea en lo más mínimo) la distribución de las probabilidades de las dis- 
tintas posibilidades de s. Pero tenemos que resistirnos a la idea de que una 
señal puede llevar la información de que, pongamos por caso, ocurrió sz 
(una entre cien posibilidades igualmente probables) si aumenta la proba- 
bilidad de que s2 ocurra de 0,01 a 0,02 y reduce proporcionalmente la pro- 
babilidad de las 99 restantes posibilidades. Tal señal no puede decirlo que 
sucedió en la fuente. Incluso si s2 sucedió de hecho, no se puede saber por 
una señal de este tipo que ocurrió. La señal lleva cierta información sobre 
la fuente, pero no suficiente para llevar el mensaje de que sucedió s». 

Lo que dice la teoría de la comunicación (junto, por supuesto, al prin- 
cipio de la copia) es que para la comunicación de contenido, para la trans- 
misión de un mensaje no sirve cualquier cantidad de información. Se ne- 
cesita toda la información asociada con ese contenido. Si la ocurrencia de 
un suceso genera X bits de información, una señal ha de llevar al menos X 
bits de información para que lleve la información de que es£ evento tuvo 
lugar. Todo lo que sea menos de X bits es demasiado poco para sostener 
este mensaje. Cualquier intento de contentarse con menos de X bits signi- 
fica, o bien el rechazo del principio de la copia o bien la aceptación de la 
tesis de que el contenido informativo (un mensaje) se puede transmitir por 
pequeña que sea la cantidad (mayor que cero) de información que se trans- 
mite. Dado que hay objeciones contra ambas posibilidades, debemos con- 
cluir que para que una señal lleve un mensaje de X bits sobre una fuente 
(por ejemplo, el mensaje de que s es F' cuando el hecho de que s sea F 
genera X bits de información), tiene que llevar por lo menos X bits de 
información sobre s. 

Transmitir un mensaje es como estar embarazada: es una cuestión de 
todo o nada. Cuando se trata de cantidades de información se puede hablar 
de cualquier cantidad, tiene sentido decir que el O, el 43 o el 100% de la 
información generada en la fuente llega al receptor. Pero cuando se trata 
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del mensaje, la información contenida en esas cantidades, la información 
se transmite por entero o no se transmite en absoluto. Cuando se habla del 
contenido, no tiene sentido hablar de transmitir el 99% de la información 
de que está lloviendo. 

Eso no significa que una señal tenga que decirlo todo sobre una fuente 
para decirnos algo. Una señal puede ser equívoca y llevar un mensaje a 
pesar de ello. En una de las situaciones que se describían en el primer ca- 
pítulo los empleados decidieron poner el nombre de Herman en su nota al 
jefe si salía Herman o Shirley. Decíamos entonces que cuando la nota en 
que estaba escrito el nombre de Herman llegaba al despacho del jefe sólo 
llevaba dos bits de información sobre qué empleado había sido elegido. 
Dado que la selección de Herman generó tres bits de información, la nota 
tenía un bit de equivocidad, que es la cantidad de información que se per- 
dió. Entonces insinuábamos (y ahora podemos ver por qué) que por ello la 
nota no llevaba la información de que Herman fue seleccionado. La nota 
de dos bits no podía llevar un mensaje de tres bits. No obstante, según la 
posición ventajosa en que ahora nos encontramos, la nota puede llevar un 
mensaje de dos bits. Esto, a su vez, concuerda felizmente con nuestra opi- 
nión intuitiva de que la nota llevaba la información de que o bien había 
salido Herman o bien Shirley, ya que el estado de cosas descrito por «o 
bien ha salido Herman, o bien Shirley» es un estado de cosas que tiene una 
medida informacional de dos bits (que suponen una reducción de ocho po- 
sibilidades igualmente probables a dos). Por tanto, nuestra nota, aunque 
era equívoca respecto a quién fue seleccionado exactamente, puede llevar 
la información de que fue Herman o Shirley. 

Eso muestra algo que ya debiera estar claro por otros motivos; a saber, 
que el que una señal sea o no equívoca depende de cómo dividamos las 
posibilidades de la fuente. Mi rey está en RA-3. El hecho de que esté en 
esa casilla en particular genera (digamos) seis bits de información, dado 
que hay 64 posibilidades. También podríamos describir su posición de una 
forma menos definida. Podríamos, por ejemplo, decir que el rey está en 
una casilla negra. En ese caso hablamos de un estado de cosas (el de que 
el rey esté en una casilla negra) que tiene una medida informacional de 
sólo un bit (ya que sólo hay dos posibilidades: casilla negra o casilla 
blanca). Podría ser que una señal no llevase más que un bit de información 
sobre la posición de mi rey. ¿Es equívoca esa señal? Con respecto a la 
primer descripción (el rey está en RA-3), sí. Respecto a la segunda (el rey 
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está en una casilla negra), no. Con respecto a la primera descripción, la 
señal tiene una equivocidad de cinco bits. Respecto a la segunda descrip- 
ción, tiene cero bits de equivocidad. Pero en ambos casos lleva un bit de 
información sobre la situación del rey. La teoría de la comunicación no 
dice que para llevar un mensaje una señal tenga que tener equivocidad 
cero, ya que el que la equivocidad sea o no igual a cero depende de cómo 
especifiquemos las posibilidades de la fuente. La equivocidad es relativa 
a cómo describimos el evento de la fuente acerca del cual se está transmi- 
tiendo Información. Lo que la teoría de la comunicación dice es que la 
cantidad de información que una señal lleva acerca de una fuente pone el 
límite superior a la información que una señal puede llevar acerca de esa 
fuente. La señal de un bit que hemos descrito más arriba puede llevar el 
mensaje de que el rey está en una casilla negra, pero no puede llevar el 
mensaje de que está en RA-3. Esta consecuencia es independiente de la 
minuciosidad con que dividamos las posibilidades de la fuente. Multipli- 
cando el número de posibilidades de la fuente (mediante descripciones más 
detalladas y precisas de las posibilidades del conjunto) se aumenta la equi- 
vocidad E de las posibles señales, pero también aumenta el valor de /(s) la 
información generada de la fuente. Dado que la cantidad de información 
transmitida [véase la formula (1.5)] es [(s) menos E, la cantidad de infor- 
mación transmitida no varía, y ésta es la magnitud que se usa para deter- 
minar qué tipo de contenido informativo se puede transmitir.5 





50 De manera parecida, una señal visual puede llevar información suficiente (cuantitativa- 
mente hablando) para tener el contenido de que s es una persona, pero no la suficiente para 
llevar el contenido de que s es una mujer. Por tanto, respecto a la descripción «s es una 
mujer», la señal tiene equivocidad positiva. Respecto a la descripción «s es una persona» 
tiene equivocidad cero. Mirar más de cerca, encender la luz, o algo así, es una forma de 
aumentar la cantidad de información que se recibe sobre s para poder ver si s es una mujer o 
un hombre (es decir, obtener la información de que s es una mujer). 


E 
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3. Una teoría semántica de la información 


Lo que hemos visto en el capítulo anterior mostraba dos condiciones 
que tiene que satisfacer una definición de información. La primera es la 
condición de la comunicación, y consiste en que si una señal lleva la in- 
formación de que s es F, entonces debe ocurrir que 


(A) La señal lleva tanta información sobre s como se genere por el he- 
cho de que s sea F. 


Así, por ejemplo, si el hecho de que s sea de un determinado color 
genera dos bits de información, ninguna señal puede llevar la información 
de que s es de un color determinado (pongamos por caso rojo) a no ser que 
lleve por lo menos dos bits de información. No obstante, es obvio que esta 
condición, si bien es necesaria, no es suficiente. Una señal puede llevar 
dos bits de información sobre el color de s sin levar la información de que 
s es rojo. En ese caso la señal no lleva la información de que s es rojo a 
pesar de llevar tanta información (dos bits) sobre el color de s como gene- 
raría el hecho de que s fuera rojo. Es necesaria otra condición. Si una señal 
lleva la información de que s es F, tiene que ocurrir que: 


(B)s es F. 


Recordemos que la selección de Herman genera la misma cantidad de 
información (tres bits) que se generaría mediante la selección de cualquier 
otro empleado. No es lo mismo que nos digan que la nota para el jefe lleva 
tres bits de información que lleva la información de que fue seleccionado 
Herman, ya que el mensaje podría llevar tres bits de información sin que 
hubiera sido seleccionado Herman. Podría llevar la información de que fue 
seleccionada Shirley. Para que lleve la información de que fue seleccio- 
nado Herman es necesario que Herman haya sido seleccionado. 

Así (A) y (B) son individualmente necesarias. Pero juntas no son sufi- 
cientes. Supongamos que s es un cuadrado rojo. El hecho «le que sea rojo 
genera tres bits de información, y el de que sea un cuadrado genera tres 
bits de información independiente. Se transmite una señal que lleva la in- 
formación de que s es un cuadrado, pero no la de que s es rojo. En ese caso, 


8) 
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la señal lleva tanta información sobre s como generaría el hecho de que s 
sea rojo, pero la señal no tiene esa información. 

Es necesario algo más. El problema es que, aunque una señal lleve X 
bits de información sobre s, y aunque el hecho de que s sea F genere X bits 
de información, la señal no lleva, por así decirlo, los X bits correctos para 
llevar la información de que s es F. Una señal no sólo debe llevar infor- 
mación suficiente, sino que tiene que llevar la información correcta. Para 
subsanar esta deficiencia hay que cumplir algo parecido a la siguiente con- 
dición: 


(C) La cantidad de información sobre s que lleva la señal es (o incluye) 
la cantidad generada por el hecho de que s sea F (y no, por ejemplo, de 
que s sea G). 


(B) y (C) forman lo que yo llamo las condiciones semánticas de la in- 
formación. La formulación de (C) deja mucho que desear. No está claro, 
por ejemplo, qué es lo que quiere decir que una cantidad (cantidad de in- 
formación que lleva la señal) sea (o incluya) otra cantidad (cantidad de 
información generada) si se pretende que eso sea algo más que una com- 
paración numérica. No obstante, (C) servirá, de momento. No pretende 
aclarar nada, sino simplemente señalar, de una manera sugerente, la nece- 
sidad de alguna cosa más allá de (A) y (B) una necesidad que es evidente 
por el hecho de que (A) y (B) no bastan para determinar la información 
que una señal lleva. 

Lo que viene a continuación es una definición de la información con- 
tenida en una señal que cumple estas tres condiciones a la vez. También 
recoge una característica de la información a la que aludirnos brevemente 
en el capítulo 2: el hecho de que la información que se transmite puede 
depender de lo que el receptor sabe sobre las posibilidades que hay en la 
fuente. Cuando formule esta definición hablaré de una señal que lleva la 
información, pero tiene que quedar claro que r puede ser cualquier evento, 
condición o estado de cosas cuya existencia (ocurrencia) pueda depender 
del hecho de que s sea F. Además supondré que el hecho de que s sea F 
siempre es un estado que tiene alguna cantidad positiva de información a 
él asociada (hay otras posibilidades, aparte de que s sea EF). Volveremos 
sobre la cuestión de las propiedades esenciales o necesarias, propiedades 
cuya posesión por parte de s genera cero información. 
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Contenido informativo: Una señal t lleva la información de que s es F = La 
posibilidad condicional de que s sea F, dada r y (K), es 1 (pero, dada sólo k, menos 
de 1). 


La K que aparece entre paréntesis se explicará ahora. Pretende señalar 
lo que el receptor ya sabe (si es que sabe algo) sobre las posibilidades que 
hay en la fuente. Así, por ejemplo, si ya se sabe que s es rojo o azul, una 
señal que eliminará la posibilidad de que s sea azul (reduce a cero su posi- 
bilidad) lleva la información de que s es rojo (dado que aumenta hasta 1 
su probabilidad). Para alguien que no sabe que s es rojo o azul (por lo que 
esta persona sabe podría ser verde), la misma señal podría no llevar la in- 
formación de que s era rojo. 

Yo diría que esta definición es la única que cumplirá a la vez las con- 
diciones (A), (B) y (C). La definición satisface (A) porque si la posibilidad 
condicional de que s sea F' (dada r) es 1, entonces la equivocidad de esta 
señal debe ser O y [de acuerdo con la fórmula (1.5)] la señal tiene que llevar 
tanta información sobre s, /, (r), como se genera por el hecho de que s sea 
F, I(sg). La condición (B) se cumple porque, si la probabilidad condicional 
de que s sea Fes 1, entonces s es F*!, y la condición (C) se cumple porque, 
cualesquiera otras cantidades de información que la señal pueda llevar so- 
bre s, nuestra definición asegura que la señal incluye la cantidad correcta 
(la cantidad asociada al hecho de que s sea FF) en virtud de la exclusión de 
las situaciones que hicieron necesaria la imposición de esta exigencia. 

Por supuesto que el hecho de que nuestra definición cumpla estas tres 
condiciones no implica que sea la única definición de contenido informa- 
cional que las cumplirá, pero creo que es evidente que ninguna otra cosa 
servirá. Se podría pensar, por ejemplo, que se podrían reducir las exigen- 
cias no pidiendo más que una probabilidad algo superior a 0,9 (o 0,99, o 
0,999). Esta modificación de la condición no cumpliría la condición (B), 





51 Al decir que la probabilidad condicional (dado r) de que s sea F es 1, quiero decir que 
existe una regularidad nómica entre esos tipos de eventos, una regularidad que impide nómi- 
camente la ocurrencia de r cuando s no es F. Hay interpretaciones de la probabilidad (la 
interpretación frecuencial) en las cuales un evento puede tener una probabilidad de 1 y aun 
así no suceder (o bien suceder cuando tiene una probabilidad de 0), pero no es así como estoy 
usando la probabilidad en esta definición. Una probabilidad condicional de 1 entre r y s es 
una forma de describir una dependencia nómica (sin excepciones) entre eventos de ese tipo, 
y por esta razón digo (en el texto) que si la probabilidad condicional de que s sea F (dado r) 
es 1, entonces s es F. En el próximo capítulo volveré a hablar de estas regularidades nómicas. 
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dado que para que un estado de cosas (el hecho de que s sea F) tenga una 
probabilidad de 0,9 (o 0,999) no es necesario que exista. Se podría subsa- 
nar esta deficiencia añadiendo a la definición una cláusula separada indi- 
cando que s fuera F. Pero entonces no se cumpliría la condición (A), dado 
que si una señal pudiera llevar la información de que s es F mientras que 
la probabilidad de que s sea F aumenta a sólo 0,9 (0,999), entonces la señal 
F, podría llevar esta información llevando menos información (cuantitati- 
vamente hablando) de lo que se genera por el hecho de que s sea F, lo cual 
constituiría una clara violación de (A).*? Puede ser que haya otras formas 
de formular la definición anterior, pero si una definición cumple las con- 
diciones (A), (B) y (C), será equivalente a la que hemos dado. 
Expresamos el contenido informativo de una señal mediante la expre- 
sión «s es F», en la que la letra s es un elemento indéxico o demostrativo 
que se refiere a algo que sucede en la fuente. La definición nos da una 
explicación de lo que los filósofos llamarían el contenido informativo de 
re de la señal, un contenido que podría expresarse (de un modo que resul- 
taría más ilustrativo) diciendo que r lleva sobre o de s la información de 
que es F. Se llama contenido de re (versus contenido de dicto) porque lo 
que se describe al describir el contenido informativo de una señal es una 
relación entre lo que se expresa mediante una oración abierta («... es F») 
y algún individuo s.** Se usa una letra minúscula de constante individual 
(normalmente una s, que sugiere la palabra fuente**) en la expresión verbal 
del contenido informativo de una señal para subrayar el hecho de que nos 





52 Siempre que la probabilidad condicional de que s sea F (dado r) es menor que 1, la pro- 
babilidad condicional de las demás posibilidades es mayor que 0. Por tanto, la equivocidad 
es positiva. En consecuencia [fórmula (1.5)], 1,(r) es menor que 1(s). 


53 En general, sigo la excelente explicación de Tyler Burge de la distinción entre los conte- 
nidos de re y de dicto en su «Belief De Re», The Journal of Philosophy, vol. 74, 6 (junio 
1977), págs. 338-362. Burge sostiene que la forma habitual de trazar la distinción de re/de 
dicto (en términos del criterio de sustituibilidad) no capta de forma adecuada la distinción 
intuitiva entre estas dos clases de creencia. No obstante, está claro que existe una estrecha 
relación entre un contenido de re (tanto si se considera contenido de la creencia como si se 
considera el contenido informativo de una señal) y la libertad de sustitución (de expresiones 
coextensivas) del término que hace de sujeto. Más adelante, en este mismo capítulo, diré algo 
más sobre la cuestión de la opacidad/transparencia tal como ésta se aplica a los contenidos 
informativos. 


54 Ésa es la letra con que empieza la palabra inglesa source, que significa «fuente». (N. de 
la T.) 
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ocupamos del individuo s, no de la expresión que utilicemos para describir 
o referirnos a ese individuo. El contenido informativo de re de una señal 
está determinado por dos cosas: 1) el individuo s acerca del que la señal 
lleva información, y 2) la información (determinada por la oración abierta 
«... es F») que lleva sobre ese individuo. No importa cuál sea la expresión 
descriptiva que estemos usando (en la expresión verbal del contenido in- 
formativo de una señal) para referirnos al individuo sobre el que la señal 
lleva información. Así, por ejemplo, si describimos la información que 
lleva una señal como la información de que mi abuela está sonriendo, debe 
entenderse que la señal no tiene por qué llevar la información de que esa 
persona es mi abuela (ni siquiera de que es una mujer o una persona), sino 
que se dice que la señal lleva información sobre mi abuela, información 
respecto al hecho de que está sonriendo. Por supuesto que la señal también 
puede llevar la información de que es mi abuela. En ese caso la señal lleva 
la información de que s es mi abuela y está sonriendo, información que 
podríamos expresar diciendo que la señal lleva la información de que mi 
abuela sonríe. Pero, generalmente, sólo los elementos descriptivos o con- 
ceptuales que contiene la expresión predicativa («... es F»), reflejan el con- 
tenido informativo de la señal. El término que hace de sujeto no hace más 
que unir ese contenido con un determinado individuo. 

Por tanto, las señales pueden distinguirse, en cuanto a la información 
que llevan, de dos maneras. Si r, lleva la información de que s es F y r» 
lleva la de que es G, entonces (suponiendo que F y G expresan caracterís- 
ticas o rasgos independientes) llevan informaciones distintas. Sin em- 
bargo, ri también puede llevar la información de que s es F' mientras que 
r2 lleva la información de que £, un individuo distinto, es F. Eso también 
es una información distinta. La información de que esto es blanco se dis- 
tingue de la información de que eso es blanco mientras esto no sea igual 
que eso.” 

A lo largo de esta obra nos limitaremos a los contenidos preposiciona- 
les de re. Cuando abordemos el análisis del conocimiento y la creencia, las 
actitudes cognitivas que adoptan un contenido preposicional; nos ocupa- 
remos también de esos contenidos en sus manifestaciones de re. Es decir, 





35 Eso no quiere decir, por supuesto, que las señales que llevan esas dos informaciones 
tengan que llevar de algún modo la información de que son informaciones distintas, a saber: 
la información de que esto eso. 
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nos ocuparemos del saber o creer de algo que ese algo es F, donde el algo 
del que se sabe o se cree que es F está determinado por factores perceptivos 
(véase el capítulo 6, Los objetos de la percepción). Esta restricción nos 
permite evitar algunos problemas espinosos relacionados con el análisis de 
los contenidos proposicionales de dicto, contenidos de la forma «El s es 
F», donde el contenido está, por lo menos en parte, en función del signifi- 
cado del término o expresión («El s») usado para designar a aquello que 
es F. No obstante, aunque mediante esta maniobra evitamos algunos pro- 
blemas,** esta explicación aspira a cierto grado de completitud, ya que se 
supone, y se justificará en capítulos posteriores, que el conocimiento y la 
creencia de re son más fundamentales que sus contrapartidas de dicto y, 
como espero mostrar, una teoría del contenido informativo de re de una 
señal basta para el análisis de nuestros conocimientos y creencias de re. 
Un examen de los ejemplos que ya hemos usado mostrará que la defi- 
nición que hemos dado del contenido informativo de una señal propor- 
ciona un resultado intuitivamente satisfactorio en ambos casos. En parti- 
cular, debería mencionarse un ejemplo en especial. Cuando los empleados 
seleccionaron a Herman, pero habían decidido poner a Herman en la nota 
que mandaron al jefe tanto si salía Herman como si salía Shirley, la teoría 
de la comunicación decía que la nota sólo llevaba dos bits de información 
sobre qué empleado había sido seleccionado (un bit de equivocidad). Pero, 
aunque esa teoría dice cuánta información lleva la nota, no dice qué infor- 
mación lleva. Por lo que respecta a esa teoría cuantitativa, la nota podría 





56 El tipo de problemas que se evita si nos centramos exclusivamente en los contenidos de 
re no son sólo los asociados con la articulación de una teoría general de la referencia, sino 
los que tienen que ver con la presuposición y (lo que en otro lugar he llamado) enfoque con- 
trastivo. Así, por ejemplo, podríamos querer distinguir los contenidos «Mi primo se comió 
las cerezas» (entendiéndose que da información sobre quién se comió las cerezas) y «Mi 
primo se comió las cerezas» (entendiéndose que da información sobre qué es lo que se comió 
mi primo), a pesar de que su expresión verbal sea idéntica. El enfoque semántico (indicado 
por las palabras puestas en itálicas y que normalmente se señala en el lenguaje oral mediante 
las diferencias de entonación o énfasis) tiene como consecuencia un cambio de las presupo- 
siciones, cambia el carácter referencial de algunas expresiones y, en general, altera el conte- 
nido asertivo de toda la expresión. Por esta razón, tal vez queramos distinguir las dos expre- 
siones mencionadas, a pesar de que sus componentes léxicos sean idénticos, diciendo que 
representan distintas informaciones y, por tanto, tal vez diferentes objetos de la creencia y el 
conocimiento. He intentado abordar algunas de esas cuestiones en «Contrastive Statements», 
Philosophical Review, octubre 1972, y «The Content of Knowledge», Forms of Representa- 
tion, Bruce Freed et al. (eds.), North Holland, Amsterdam, 1975. 


== 
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llevar toda una serie de mensajes distintos con tal de que esos mensajes 
tuvieran una medida de dos bits. Así, por ejemplo, la nota podría llevar la 
información de que fue seleccionado o bien Herman o bien Shirley (dos 
bits), o podría llevar la información de que fue seleccionado Herman o fue 
seleccionado Donald (dos bits). Tanto uno como otro de esos posibles 
mensajes es verdadero (ya que fue seleccionado Herman). Por tanto, am- 
bos se consideran información que podría llevar la nota. Nuestra definición 
del contenido proposicional de una señal distingue claramente entre uno y 
otro. Se decide por Herman o Shirley como contenido y no por Herman o 
Donald porque la primera posibilidad (dado el nombre que aparece en la 
nota) tiene probabilidad 1, mientras que la segunda posibilidad sólo tiene 
una probabilidad de 0,5. Esto cuadra muy bien con nuestras intuiciones 
preanalíticas de que la nota lleva la información de que o bien fue selec- 
cionado Herman o bien lo fue Shirley. No lleva la información de que fue 
seleccionado Herman o bien lo fue Donald, a pesar de que fue seleccionado 
Herman o Donald y la nota lleva (cuantitativamente) suficiente informa- 
ción (dos bits) para tratar ese mensaje. 

Hasta ahora he escogido cuidadosamente los mensajes de tal manera 
que su contenido sea siempre identificable. No obstante, no todas las se- 
ñales tienen un contenido informativo que se preste de forma tan clara y 
económica a la expresión proposicional. Supongamos que s puede estar en 
uno de cuatro estados diferentes, que son todos igualmente probables: A, 
B, C y D. Supongamos, además, que s ocupa el estado B y una señal r lleva 
un bit de información sobre la situación de s. Una señal puede llevar de 
maneras distintas un bit de información sobre cómo está s. Podría, por 
ejemplo, reducir a O la probabilidad de A y D y dejar igual la probabilidad 
de B y C. En ese caso la señal lleva un bit de información y (según nuestra 
definición) lleva la información de que s está en el estado B o en el estado 
C. Pero la señal también podría alterar la configuración de probabilidades 
de tal manera que proporcionase un bit de información. Si, por ejemplo, 
las probabilidades condicionales son las siguientes: 


P(A/r) = 0,07 
P(B/r) = 0,80 
P(C/r) = 0,07 
P(D/r) = 0,06 
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entonces la aplicación de la fórmula (1.8) revela que la equivocidad de r 
es de un bit. Por tanto, r lleva un bit de información sobre el estado de s. 
¿Cuál es el contenido de esta señal? ¿Cuál es el mensaje? Obviamente, no 
podemos suponer que la señal lleva la información de que s está en el es- 
tado B, porque, incluso si s está en el estado B, eso genera dos bits de 
información y nuestra señal sólo lleva un bit. Tampoco podemos suponer 
que la señal lleva la información (pongamos por caso) de que s está en el 
estado B o en el estado C, dado que, aunque s esté en el estado B o en el 
estado C, y aunque eso sólo tiene una medida de un bit, nuestra definición 
dice que no es el bit de información que lleva la señal (ya que la probabi- 
lidad de ese estado es menor que 1). No existe, de hecho, ninguna forma 
no cualificada de expresar la información que lleva esta señal. Lo mejor 
que podemos hacer en tales casos es decir que la señal lleva la información 
de que s está probablemente en el estado B. Eso es lo que se adecúa en 
mayor grado a nuestra definición de contenido condicional de que s sea 
probablemente B, dado r, es igual a 1. No estoy seguro de que tenga sen- 
tido hablar así. Por supuesto, es absurdo pensar que el que s sea B proba- 
blemente sea por sí mismo una forma de esta s acerca de la cual podamos 
recibir información, algo que podría tener una probabilidad condicional de 
1 y así contar como contenido informativo de una señal. Pero eso no es lo 
importante. Cuando no hay ninguna oración que describa la situación de 
la fuente y que cumpla nuestra definición de contenido informativo, y a 
pesar de ello queremos dar una expresión proposicional a la cantidad de 
información que se transmite, estamos obligados a adoptar el recurso de 
hablar del hecho de que algo es así probablemente como el contenido in- 
formativo de una señal. 

No debe considerarse este resultado como una debilidad de nuestra de- 
finición del contenido informativo de una señal. Muy al contrario, refleja, 
creo yo, una práctica común a la hora de expresar la información que reci- 
bimos. Por ejemplo, algunos jugadores de bridge por parejas, nunca ini- 
cian la declaración con picos o corazones, a no ser que tengan por lo menos 
cinco cartas de ese palo. Por tanto, la declaración inicial de «un corazón» 
por parte de uno de esos jugadores lleva la información de que tiene uno o 
más corazones. Otras parejas abrirán de vez en cuando uno de esos dos 
palos con tan sólo cuatro cartas de ese palo, menos información que en el 
primer caso, pero sigue siendo una cantidad significativa de información. 
No obstante, algunos jugadores hacen a veces declaraciones «psíquicas» 
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(no tienen nada o casi nada que corresponda al significado convencional 
de su declaración). Una declaración de «un corazón» por parte de uno de 
esos jugadores todavía llevará información acerca del carácter de la mano. 
Incluso si normalmente tiene cinco (o más) corazones cuando los declara, 
las declaraciones psíquicas que hace de vez en cuando degradan la infor- 
mación que lleva su declaración hasta el punto de que es difícil decir exac- 
tamente qué información se está comunicando. Lo más que se puede decir 
es que probablemente esa persona tiene cinco (o más) corazones, tal vez 
sólo cuatro y, posiblemente, ninguno. Eso es lo mejor que se puede hacer 
para expresar proposicionalmente la información comunicada por esa de- 
claración. 

Es importante observar que, en general, no tiene demasiado sentido 
hablar del contenido informativo de una señal, ya que si una señal lleva la 
información de que s es F, y el hecho de que s sea F lleva, a su vez, la 
información de que s es G (o £ es H), entonces esa misma señal lleva tam- 
bién la información de que s es G (o t es H). Por ejemplo, si r lleva la 
información de que s es un cuadrado, también lleva la información de que 
s es un rectángulo. Ello se debe a que si la probabilidad condicional (dado 
r) de que s sea un cuadrado es 1, entonces la probabilidad condicional 
(dado r) de que s sea un rectángulo también es 1. Además, esa señal llevará 
también la información de que s es un cuadrilátero, un paralelogramo, no 
un círculo, ni un pentágono, un cuadrado o un rectángulo, etc. De manera 
parecida, si la dilatación del mercurio lleva la información de que está au- 
mentando la temperatura, entonces cualquier señal que lleve la informa- 
ción de que se está dilatando el mercurio lleva también la información de 
que está aumentando la temperatura. Eso es lo que convierte a los termó- 
metros en aparatos útiles para averiguar la temperatura. En general, si hay 
una ley de la naturaleza que dice que siempre que s es F, tes G (convir- 
tiendo así en 1 la probabilidad condicional de que t sea G, dado que s es 
F), no hay ninguna señal que pueda llevar el mensaje de que s es F sin 
proporcionar al mismo tiempo la información de que 1 es G. 

Esto se puede expresar diciendo que si una señal lleva la información 
de que s es F, también lleva la información contenida en el hecho de que 
s sea F. Eso se sigue inmediatamente de nuestra definición del contenido 
informativo de una señal y de la siguiente definición de la relación de estar 
incluido. 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


La información de que tes Gestá incluida en el hecho de que s sea F=el hecho 
de que s sea F lleva la información de que tes G. 


En algún momento consideraré conveniente distinguir entre la infor- 
mación que está analíticamente incluida en un estado de cosas y la infor- 
mación que está nómicamente incluida en un estado de cosas (incluida en 
virtud de ciertas leyes de la naturaleza). Al usar esta terminología no me 
refiero a nada muy profundo o complicado. No pretendo de ningún modo 
adoptar postura alguna en la filosóficamente controvertida distinción entre 
lo analítico y lo sintético. Esta terminología no es más que una forma de 
señalar ciertas aparentes diferencias en la forma en que la información 
puede estar incluida. No importa para nada de lo que sigue si esas aparen- 
tes diferencias son realmente diferencias específicas o no son más que di- 
ferencias de grado. Para nuestros propósitos sólo importa el hecho de que 
una información puede estar incluida en otra, no cómo esté contenida. No 
obstante, la terminología es sugerente, y resultará útil para nuestro examen 
de la creencia y la formación de conceptos de la tercera parte. Por esta 
razón, distinguiré a menudo entre esas dos formas de la relación de inclu- 
sión incluso cuando lo que diga dependa poco de esa distinción. Así, por 
ejemplo, diré que la información de que s es un rectángulo (o no es un 
círculo, o es un rectángulo o un círculo) está analíticamente incluida en el 
hecho de que s sea un cuadrado. En cambio, el hecho de que yo pese más 
de 80 kilos está nómicamente incluido (si es que lo está de alguna manera) 
en la lectura de mi balanza de baño. 

No tiene, por tanto, demasiado sentido, hablar del contenido informa- 
tivo de una señal como si éste fuera único. En general, una señal lleva 
muchos contenidos informativos distintos, muchas informaciones distintas 
y, aunque esas informaciones puedan estar relacionadas (por ejemplo, ló- 
gicamente), no por eso dejan de ser informaciones distintas. La señal acús- 
tica que nos dice que hay alguien en la puerta no sólo lleva la información 
de que hay alguien en la puerta, sino también la información de que ha 
sido pulsado el timbre, de que fluye electricidad a través del circuito del 
timbre, que está vibrando el badajo del timbre, y muchas más. De hecho, 
toda la información que está (analítica o nómicamente) incluida en esos 
estados de cosas también forma parte del contenido informativo de la señal 
acústica. Ninguna información tiene el status de el contenido informativo 
de la señal. El receptor de la señal puede estar más interesado en una in- 


= gp 
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formación que en cualquier otra, puede ser que consiga extraer una infor- 
mación sin otra, pero nada de eso es pertinente para la información que 
contiene la señal. 

Esta característica de la información sirve para distinguirla claramente 
del concepto de significado, por lo menos del concepto de significado que 
importa para los estudios semánticos del lenguaje y la creencia. En enun- 
ciado «Joe está en casa» puede querer decir que Joe está en casa (sea lo 
que sea lo que la persona que lo dice quiera decir). Por supuesto no signi- 
fica que Joe está en casa o en el despacho. El enunciado implica que Joe 
está en casa o en el despacho, pero no es eso lo que significa. Por otra 
parte, si el enunciado lleva la información de que Joe está en casa, lleva 
por esa razón la información de que Joe está en casa o en el despacho: no 
puede comunicar una información sin comunicar la otra. Una información 
está analíticamente incluida en la otra. 

La diferencia entre el significado y la información se hace todavía más 
evidente cuando examinamos casos de información nómicamente in- 
cluida. Supuesto que es una ley de la naturaleza que el agua se dilata 
cuando se congela, ninguna señal puede llevar la información de que cierta 
masa de agua se está congelando sin llevar la información de que esa masa 
de agua se está dilatando. Pero el enunciado «Esta masa de agua se está 
congelando» puede significar que esta masa de agua se está congelando 
sin significar que esta masa de agua se está dilatando. 

Puede parecer que el contenido informativo de una señal amenaza con 
desbordarse. Nuestro examen ha mostrado que cuando una señal r lleva la 
información de que s es F, también lleva la información de que s (o £) es 
G cuando el hecho de que s (o £) es G está incluido (ya sea nómica o ana- 
líticamente) en el hecho de que s es F. Parece que las señales estén ges- 
tando información. Y lo están. No obstante, hay obviamente gran cantidad 
de información que la señal no lleva. Ya hemos visto muchos ejemplos de 
ello. En ciertas circunstancias, la nota al jefe no llevaba ninguna informa- 
ción sobre cuál de los empleados fue seleccionado. En otro ejemplo, aun- 
que fue seleccionado Herman y la nota llevaba el nombre «Herman», no 
llevaba la información de que Herman fue seleccionado. Sólo llevaba la 
información de que o bien fue seleccionado Herman o bien resultó selec- 
cionada Shirley. 

Cualquier señal que lleve la información de que s es agua contiene por 
ello la información de que s está compuesto de moléculas de H20. Eso 
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supone que la probabilidad condicional de que s esté compuesto de molé- 
culas de H20, dado que es agua, es 1, pero todo hace suponer que eso es 
así. Mientras que el supuesto sea verdadero, independientemente de que 
sepamos o no si lo es, el hecho de que s está compuesto de moléculas de 
HO es información que llega con todas las señales que llevan la informa- 
ción de que s es agua. Pero incluso si el agua es salada, una señal no tiene 
por qué llevar la información de que s es agua salada sólo porque lleva la 
información de que s es agua, dado que la probabilidad condicional de que 
s sea agua salada puede ser menor que 1 a pesar de que la probabilidad de 
que s sea agua es 1 y de que s sea, de hecho, salada. 

El último ejemplo es instructivo porque pone de manifiesto que la ver- 
dad sola, incluso cuando la verdad en cuestión es una verdad absoluta- 
mente general que expresa una uniformidad sin excepciones, no basta para 
transmitir información. Las correlaciones, incluso si lo impregnan todo, no 
deben confundirse con las relaciones informativas. Aunque las propieda- 
des de F y G estén perfectamente correlacionadas (todo lo que es F' es G, 
y viceversa), eso no significa que en el hecho de que s sea F haya infor- 
mación sobre el hecho de que s sea G (o viceversa). No significa que una 
señal que lleva la información de que s es F' también lleva la información 
de que s es G, ya que la correlación que existe entre F' y G puede ser una 
mera coincidencia, una correlación cuya persistencia no está asegurada por 
ninguna ley de la naturaleza o principio lógico. Puede ser que todos los F 
sean G sin que la probabilidad de que s sea G, dado que es F, sea 1. 

Para ilustrar este punto, supongamos que todos los hijos de Herman 
tienen el sarampión. A pesar de la «correlación», una señal podría llevar 
la información de que Alice es uno de los hijos de Herman sin llevar la 
información de que Alice tiene el sarampión. Probablemente el hecho de 
que todos los hijos de Herman (que viven en distintos lugares del país) 
hayan contraído el sarampión al mismo tiempo no hacen que la probabili- 
dad de que tengan el sarampión, dado su parentesco, sea igual a 1. Dado 
que esto es así, una señal puede llevar la información de que Alice es uno 
de los hijos de Herman sin llevar la información de que tiene el sarampión 
a pesar de que todos los hijos de Herman tienen el sarampión. Este hecho 
ayuda a explicar (como veremos en la segunda parte de este libro) por qué 
a veces podemos ver que (y, por tanto, saber que) s es F sin poder decir si 
ses Ga pesar de que todos los F' son G. Reconocer a Alice como uno de 
los hijos de Herman no es suficiente para hacer un diagnóstico médico, 
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independiente de lo que resulte ser verdad acerca de los hijos de Herman. 
Eso sólo es significativo de cara a hacer un diagnóstico si la correlación es 
una manifestación de una regularidad nómica (por ejemplo, genética) entre 
el hecho de ser uno de los hijos de Herman y tener el sarampión. 

Tal vez vea mejor este mismo punto si pensamos en dos sistemas de 
comunicación: A-B y C-D. A transmite a B y C transmite a D. Por una pura 
casualidad, y en el mismo preciso instante, A emite exactamente el mismo 
mensaje (secuencia de puntos y guiones) a B que C emite a D. Suponiendo 
que nunca se transmite ningún otro mensaje, y suponiendo que los canales 
son perfectamente fiables (B recibe réplicas exactas de lo que transmite A 
y D recibe réplicas exactas de lo que C transmite), existe una perfecta co- 
rrelación (durante todo el tiempo) entre lo que A transmite y lo que D re- 
cibe. Pero, a pesar de esa correlación D no recibe ninguna información de 
A. Para que sea todavía más vivido, podríamos imaginar que el sistema A- 
B está separado por cientos de años-luz del sistema C-D. No existen bases 
físicas para la comunicación. Aun así, la correlación entre lo que ocurre en 
A y Des perfecta (por lo menos tan perfecta como lo que ocurre entre A y 
B). Es ineludible la conclusión de que la perfecta correlación no basta para 
la transmisión de información. La razón de que A no se comunique con D, 
pero sí se comunique con C, es que existe una dependencia nómica entre 
lo que sucede en A y en B, pero no entre lo que sucede en A y D, y son 
estas dependencias nómicas las que determinan la cantidad de información 
(y, por tanto, indirectamente, qué información) que fluye entre dos puntos. 
Si la probabilidad condicional de que C transmita un guión, dado que A 
transmite un guión, es tal que queda reducida a mera casualidad (como 
presuponíamos al suponer que el hecho de que A y C transmitieran el 
mismo mensaje era una pura coincidencia), entonces la probabilidad con- 
dicional de que D reciba un guión, dado que A transmitió uno, también es 
tal que hace de esto una cuestión de pura casualidad. Por tanto, la equivo- 
cidad entre A y D es máxima a pesar de la perfecta correlación que existe 
entre ellas. No pasa ninguna información de una a otra. 

Este hecho nos dice algo fundamental sobre el contenido informativo 
de una señal. Si una señal lleva la información de que s es F, no lleva 
necesariamente la información de que s es G, a pesar de la equivalencia 
extensional de «F» y «G». Aunque «F» y «G» son verdad de exactamente 
las mismas cosas (tienen la misma extensión) , la información de que s es 
F es distinta de la información de que ses G. 
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Los filósofos tienen un término especial para describir ese tipo de fe- 
nómenos: intencionalidad (o, si hablamos de las oraciones que se usan 
para describirlos: intencionalidad). Uno de los criterios que hacen que una 
oración sea considerada intencional es que la sustitución de las expresio- 
nes predicativas de la misma por expresiones predicativas coextensivas 
varíen (o puedan variar) el valor de verdad de la oración en su conjunto. 
Así, por ejemplo, «El cree que s es F» es una oración intencional (y la 
actitud o estado que describe es un estado intencional) porque incluso 
cuando «F» y «G» son coextensionales (verdaderos de exactamente las 
mismas cosas), no se puede sustituir «G» por «FF» en esa oración sin arries- 
garse a que varíe el valor de verdad de la misma. Es decir, «Él cree que s 
es G» podría ser falsa incluso si todo lo que es F es G, y viceversa. Hay 
una gran variedad de oraciones intencionales (y los correspondientes esta- 
dos intencionales). Muchas de esas oraciones describen lo que normal- 
mente se consideran fenómenos psicológicos. Pretender, creer, saber, es- 
perar que, desear, planear e imaginar son actitudes, estados o procesos in- 
tencionales. Las oraciones que describen lo que alguien pretende, cree, 
sabe, espera, desea, planea e imagina son todas intencionales de una u otra 
manera. 

Eso es sugerente, ya que, como hemos visto, el flujo de la información 
presenta una forma de intencionalidad parecida. Del mismo modo que las 
oraciones que describen lo que alguien sabe o cree son intencionales, tam- 
bién lo son las oraciones que describen la información que lleva una señal. 
Del mismo modo que del hecho de que $ cree que s es F (y del hecho de 
que «F» y «G» sean coextensionales) no podemos inferir que S cree que s 
es G, tampoco podemos inferir que una señal lleva la información de que 
ses G del hecho de que una señal lleve la información de que s es F (y del 
hecho de que «FF» y «G» son coextensionales). La información que lleva 
una señal presenta el mismo tipo de intencionalidad que lo que creemos o 
sabemos. Eso sugiere que podemos entender la peculiar estructura inten- 
cional de nuestros estados cognitivos como síntomas de su subyacente ca- 
rácter informacional. Tal vez la intencionalidad de nuestras actitudes (el 
modo en que tienen un contenido único), un rasgo que algunos filósofos 
consideran distintivo de lo mental, sea una manifestación de su subyacente 
estructura informacional. 
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Tengo la intención de desarrollar estas sugerencias, pero no en este 
momento. Ese será el tema de la tercera parte del libro. De momento, bas- 
tará con observar que nuestra definición de información proporciona algo 
que tiene características intencionales y, en esa medida, paralelas a nuestro 
concepto común, semántico, de información. Del mismo modo que nor- 
malmente distinguimos la Información de que s es F de la información de 
que s es G, a pesar de que todos (y sólo) los F' son G, nuestra definición 
del contenido Informativo de una señal distingue informaciones extensio- 
nalmente equivalentes. En este sentido, y en esa medida, los enunciados 
que describen la información que lleva una señal son descripciones inten- 
cionales, y los fenómenos que describen se consideran fenómenos inten- 
cionales. 

La fuente última de la intencionalidad inherente a la transmisión y re- 
cepción de información son, por supuesto, las regularidades nómicas de 
las que depende esa transmisión de información. La transmisión de infor- 
mación exige no sólo un conjunto de correlaciones de facto, sino una red 
de dependencias nómicas entre el estado de la fuente y las propiedades de 
la señal. Las probabilidades condicionales que se usan para calcular el 
ruido, la equivocidad y la cantidad de información transmitida (y, por 
tanto, las probabilidades condicionales que definen el contenido informa- 
tivo de la señal) están determinadas por las relaciones nómicas que existen 
entre la fuente y la señal. Las correlaciones no tienen relevancia alguna si 
no son la manifestación de conexiones nómicas. Y, dado que la conexión 
nómica entre dos propiedades o magnitudes es en sí misma un fenómeno 
intencional, la información recibe su carácter intencional de las regulari- 
dades nómicas de las que depende.” 





37 Normalmente, el aspecto intencional o semántico de la información se oculta o suprime 
en las aplicaciones tecnológicas de la teoría de la comunicación por el hecho de que para 
determinar las posibilidades y probabilidades pertinentes se usan datos estadísticos. Así, por 
ejemplo, si F y G están perfectamente correlacionados, la probabilidad de G, dado F, es igual 
a 1. Esta práctica colapsa la distinción entre una mera correlación (casual) entre F y G y una 
dependencia nómica, y da la impresión de que esta distinción no es importante para el flujo 
de la información, ni para la determinación de las probabilidades condicionales que definen 
E (equivocidad), N (ruido) e /s(r) (cantidad de información transmitida). 

Es evidente que esta impresión no es correcta. Las correlaciones sólo son pertinentes para 
la determinación de las relaciones informacionales en la medida en que manifiesten regula- 
ridades nómicas subyacentes. En la mayor parte de las aplicaciones de la teoría de la comu- 
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La información recibe sus propiedades intencionales de las regularida- 
des nómicas de las que depende. Pero (alguien podría preguntar), ¿de 
dónde proviene el carácter intencional de las leyes? Esa es una cuestión 
muy discutida en filosofía de la ciencia, una controversia en la que no ne- 
cesitamos entrar, dado que lo que se discute no es sí las leyes tienen carac- 
terísticas intencionales, sino cómo debe entenderse ese carácter intencio- 
nal. Existen grandes discrepancias respecto a cómo es mejor analizar esa 
peculiar característica de las leyes naturales, pero hay un acuerdo casi uni- 
versal en que las leyes tienen ese rango peculiar. Por ejemplo, si es una ley 
de la naturaleza que todos los A son B, el hecho de que «B» y «C>» sean 
coextensionales no implica que haya una ley de la naturaleza por la cual 
todos los A son C. Como máximo implica que todos los A son (de hecho) 
C, no que todos los A tenga que ser C. A menudo se describe este rasgo de 
las leyes de la naturaleza diciendo que las leyes tienen un carácter modal 
(dicen lo que tiene que ocurrir o lo que no puede ocurrir) que no está pre- 
sente en las meras enunciaciones de correlaciones que no tienen excepcio- 
nes. Del hecho de que todos los A sean B (correlación sin excepciones) no 
se sigue que cualquier A tenga que ser B, no se sigue que si este no-B fuera 
un A, también sería un B. Pero de las auténticas leyes de la naturaleza sí 
que se sigue. Dicen lo que sucedería si se cumplieran ciertas condiciones 
(si el metal se calentase, se dilataría) y lo que no puede suceder de ningún 
modo a pesar de todos los esfuerzos que hiciéramos para que sucediera 
(por ejemplo, hacer que un objeto viaje a una velocidad superior a la de la 





nicación (por ejemplo, en las telecomunicaciones) es eso lo que sucede. De hecho, normal- 
mente hay un elaborado cuerpo teórico detrás de la atribución de probabilidades. Se usan las 
correlaciones para definir las probabilidades condicionales pertinentes porque estas correla- 
ciones se consideran indicativas de dependencias nómicas. No obstante, es importante obser- 
var que no son las correlaciones las responsables de, o significativas para, el flujo de la in- 
formación. Lo importante son las regularidades nómicas subyacentes que se supone que se 
manifiestan mediante las correlaciones. Esto es evidente cuando se examinan casos en los 
que no existe ninguna regularidad nómica subyacente. El ejemplo del texto (dos sistemas de 
comunicación independientes, A-B y C-D) es un caso paradigmático. 

La auténtica comunicación sólo se produce cuando las correlaciones estadísticas manifies- 
tan procesos nómicos subyacentes, procesos que tienen la autoridad modal de aprobar las 
atribuciones de posibilidad y probabilidad. Sólo ignorando estos hechos acerca de los presu- 
puestos implícitos en las aplicaciones de la teoría de la comunicación se puede hacer como 
si la teoría de la comunicación estuviera libre de los rasgos intencionales de la auténtica in- 
formación. 
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luz). Es precisamente en este carácter modal de las leyes donde radica uno 
de los principales problemas filosóficos que plantean. Pero el problema no 
es si las leyes tienen ese carácter intencional, modal, sino de dónde pro- 
viene (cómo analizarlo). Para nuestros propósitos no importa de dónde sa- 
can las leyes de la naturaleza esa desconcertante propiedad. Lo que im- 
porta es que la tengan, ya que hemos seguido la pista de los aspectos in- 
tencionales de la información hasta los aspectos intencionales de las leyes 
de la naturaleza, y estamos dispuestos a dejar aquí la cuestión recordando 
que falta la clarificación última de nuestro concepto de información (en 
particular su aspecto intencional o semántico) junto a la clarificación de la 
autoridad modal de las leyes de la naturaleza.** 

Todavía queda un punto por aclarar. Nuestra definición del contenido 
informativo hace referencia a lo que el receptor ya sabe (k) sobre las posi- 
bilidades que hay en la fuente. Para ilustrarlo, supongamos que hay cuatro 
conchas y que se esconde un cacahuete bajo una de ellas.*? Cuando intento 
averiguar bajo cuál de ellas está el cacahuete, doy la vuelta a las conchas 
1 y 2 y descubro que están vacías. En ese momento aparece alguien y se 
une a la investigación. No se le informa de lo que yo ya he descubierto. Le 
damos la vuelta a la concha 3 y descubrimos que está vacía. ¿Cuánta in- 
formación recibe esa persona a partir de esa observación? ¿Cuánta recibo 
yo? ¿Recibimos la misma información? 

Pueden darse intuiciones distintas sobre cómo es mejor caracterizar esa 
situación en términos informacionales. Por una parte, la observación de la 
concha 3 me dice dónde está el cacahuete, pero no se lo dice a la otra 





58 He intentado un análisis en «The Laws of Nature», Philosophy of Science, vol. 44, n* 2 
(junio 1977). 


359 En este ejemplo se supone que sólo hay un cacahuete bajo las conchas, y que esto lo 
saben todas las partes interesadas. Si hubiera otras posibilidades (por ejemplo, que no hubiera 
ningún cacahuete), entonces habría una cantidad positiva de información asociada al hecho 
de que hubiera un cacahuete bajo las conchas. En este caso, el hecho de que el cacahuete se 
encontrase bajo la concha 4 tendría una medida informacional superior a dos bits (dado que 
habría más de cuatro posibilidades igualmente probables) y el hecho de que el cacahuete no 
se encontrase bajo la concha 1 hubiera tenido una medida informacional menor de la que 
tenía en el ejemplo (dado que la probabilidad de que la concha estuviera vacía sería mayor 
de 0,25). Estos valores así cambiados muestran que en estas circunstancias no se puede saber 
dónde está el cacahuete (por ejemplo, que está bajo la concha 4) porque se encuentren vacías 
tres de las conchas. 
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persona. Dado que yo me he enterado de algo de lo que ella no se ha en- 
terado, tendremos que concluir que la observación contenía más informa- 
ción para mí que para ella. He recibido de esa observación más informa- 
ción que ella. Pero, por otra parte, sabemos que no ha sido únicamente esa 
observación la que me ha «dicho» dónde estaba el cacahuete. Todo lo que 
esa observación me ha «dicho» es que el cacahuete no estaba bajo la con- 
cha 3, que es lo mismo que ha dicho a la otra persona. Lo que me permite 
determinar dónde está el cacahuete es la tercera observación junto con mis 
dos descubrimientos anteriores. Así, según, esta segunda línea de razona- 
miento, la observación que hicimos juntos de la concha 3 lleva la misma 
información para ambos. La razón por la que yo me enteré de más cosas 
que la otra persona (a saber, de que el cacahuete estaba bajo la concha 4) 
es que yo ya sabía más cosas al empezar. La información de que el ca- 
cahuete está bajo la concha 4 la lleva el conjunto formado por las tres se- 
ñales, no una única observación. Por tanto, no es cierto que me enterase 
de más cosas mediante la tercera observación. Me enteré de algo de lo que 
no se enteró la otra persona, pero porque recibí tres señales que llevaban 
información, y ella sólo una, y lo que llegásemos a saber dependía (en ese 
caso) de que recibiéramos las tres. 

Cuando examina un tipo de ejemplo parecido a éste, Daniel Dennet 
concluye que: «la información que la gente recibe cuando se les habla de- 
pende de lo que ya saben y no es susceptible de ser cuantificado con pre- 
visión».% Propongo que se siga a Dennet en la relativización de la infor- 
mación contenida en una señal, porque creo que eso refleja exactamente el 
modo en que habitualmente se consideran estas cuestiones. Pero, al con- 
trario que Dennet, no creo que eso signifique que no podamos cuantificar 
con precisión la cantidad de información contenida en una señal. Tampoco 
significa que tengamos que abandonar nuestro análisis de la información 
que contiene una señal. El ejemplo anteriormente mencionado lo pone de 
manifiesto. Cuando ya he examinado las conchas 1 y 2, sé que están vacías. 
El cacahuete está o bien bajo la concha 3, o bien bajo la concha 4. Cuando 
damos la vuelta a la concha 3 y no hay nada, las dos posibilidades quedan 
reducidas a una. Por tanto, la tercera observación me proporciona un bit 
de información sobre dónde está el cacahuete. La otra persona, en cambio, 





$0 D, C. Demnet, Content and Consciousness, Routledge £ Kegan Paul, Londres, 1969, pág. 
187. 
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emprende el examen de la concha 3 ignorando el resultado de las dos pri- 
meras observaciones. Para esa persona hay cuatro posibilidades y el exa- 
men de la concha 3 las reduce a tres. Por tanto, sólo recibe 0,42 bits de 
información respecto a dónde se encuentra el cacahuete. Dado que hay dos 
bits de información asociada al hecho de que el cacahuete esté bajo la con- 
cha 4, recibe demasiado poca información para encontrar el cacahuete. 
Todo lo que sabe es que la concha 3 está vacía (0,42 bits). En cambio, la 
tercera observación me proporciona la información de que la concha 3 está 
vacía (un bit) y la información de que el cacahuete está bajo la concha 4 
(un bit). Esta última información está incluida (para mí) en la anterior. Para 
la otra persona no lo está. 

Eso supone una relativización de la información contenida en una se- 
ñal, porque la cantidad de información que contiene una señal, y por tanto 
qué información lleva, depende de lo que el potencial receptor ya sabe 
sobre las diversas posibilidades que hay en la fuente. La cantidad de infor- 
mación generada por el hecho de que el cacahuete se encuentre bajo la 
concha 4 depende, por supuesto, de cuáles sean las posibilidades alterna- 
tivas. Si sé que el cacahuete no está bajo las conchas 1 y 2, sólo hay dos 
posibilidades, e I(s), la cantidad de información asociada al hecho de que 
el cacahuete esté bajo la concha 4, es un bit. No obstante, para la otra per- 
sona todavía hay cuatro posibilidades (todas igualmente probables), y así 
la cantidad de información asociada con el hecho de que el cacahuete esté 
bajo la concha 4 es de dos bit. Eso explica perfectamente (por lo menos en 
términos cuantitativos) por qué la tercera observación me «dijo» dónde se 
encontraba el cacahuete y no se lo dijo a la otra persona. Me «dijo» dónde 
estaba el cacahuete porque la observación me proporcionó todo el bit de 
información asociada al hecho de que el cacahuete se encontrara bajo la 
concha 4. La misma observación sólo le proporcionó 0,42 bits de informa- 
ción a la otra persona, mucho menos que los dos bits de información aso- 
ciada (para esa persona) al hecho de que el cacahuete estuviera bajo la 
concha 4. Su mayor ignorancia requiere una cantidad de información pro- 
porcionalmente mayor para compensarla. Esa mayor cantidad de informa- 
ción (dos bits) no le es asequible en el examen de la tercera concha. Por 
tanto, sigue ignorando dónde está el cacahuete. Me entero de dónde está el 
cacahuete porque recibo suficiente información (un bit) de esa tercera ob- 
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servación para obtener la información de que el cacahuete está bajo la con- 
cha 4. Sabiendo lo que sé, se necesita menos información (cuantitativa- 
mente hablando) para darme esa información a mí que a la otra persona. 

Hasta ahora nos hemos complicado en la inofensiva ficción de que el 
número de posibilidades que hay en la fuente (y sus respectivas probabili- 
dades) estaba fijado independientemente de lo que tino pudiera saber. Esa 
ficción permitía desarrollar la estructura informacional sin complicaciones 
que distrajeran nuestra atención. Además, a menudo la ficción ha resultado 
inofensiva por el hecho de que la evaluación de la información contenida 
en una señal (tanto la cantidad de información como qué información) se 
ha llevado a cabo sobre la base de un conocimiento común compartido en 
el que se sumergen las diferencias individuales.*! Es decir, lo que se sabe 
sobre las distintas posibilidades que hay en la fuente (la k de nuestra defi- 
nición de contenido informativo) es lo mismo para todos los receptores 
que hacen al caso, y el examen puede continuar (en la práctica) como si lo 
que se examina fuera absoluto y fijo: Hacemos lo mismo que cuando se 
examinan magnitudes relativas como el peso, la velocidad y la simultanei- 
dad. Sólo cuando hay un cambio de los sistemas de referencia surge la 
necesidad de explicitar la naturaleza relativa de la cantidad que se está 
considerando. La información no difiere de ellas en este sentido. Es una 
cantidad relativa, pero para muchas cosas no se gana nada recordando este 
punto, ya que generalmente se sobreentiende un marco común. Cualquier 
individuo sabe lo mismo sobre las posibilidades que hay en la fuente. 
Cuando eso es así, podemos seguir con los cálculos como si estuviéramos 
tratando con una cantidad absoluta. 

Como indica el ejemplo, el conocimiento previo de un receptor es un 
factor a tener en cuenta para saber la información que recibe (tanto cuánta 
información como qué información recibe) sólo en la medida en que afecte 
al valor de /(s), la cantidad de información generada en la fuente por la 





61 Comentando el carácter relativo de la información, Donald M. MacKay observa: «Por 
supuesto que esto no hace, en principio, que el concepto sea menos objetivo, porque siempre 
se puede postular un “receptor estándar” y esto es, de hecho, lo que se hace en teoría de la 
comunicación. Pero impide que la magnitud a él asociada tenga un único valor. La misma 
cosa puede tener contenidos informativos totalmente distintos para distintos receptores.» 
Véase MacKay: Information, Mechanism and Meaning, The M.I.T. Press, Cambridge, Mass., 
1969, pág. 96 (nota a pie de página). 
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existencia de un estado de cosas determinado. Si el conocimiento del re- 
ceptor no afecta el valor de /(s), entonces no es pertinente para saber cuánta 
y qué información está recibiendo. Concretamente, no importa si una per- 
sona sabe que la señal que está recibiendo es fiable y otra no lo sabe. Mien- 
tras la señal sea fiable, se sepa o no que lo es, /s(r), la cantidad de informa- 
ción sobre la fuente que llega al receptor, es igual a 1(s), la cantidad de 
información generada en la fuente. Lo que convierte a /x(r) en una cantidad 
relativa no es lo que el receptor sabe sobre la situación de la fuente acerca 
de la cual está obteniendo información. 

Volveremos sobre esta importante cuestión en la segunda parte, cuando 
analicemos la naturaleza del canal de comunicación a través del cual se 
recibe la información. En ese momento se suscitará la cuestión de qué es 
lo que constituye una posibilidad legítima para calcular la información que 
se transmite y se recibe. De momento aplazamos esta cuestión porque su 
correcto tratamiento nos lleva al centro de los temas escépticos de la posi- 
bilidad del conocimiento, preguntas sobre si la información (que implica 
una probabilidad condicional de 1) puede transmitirse de un lugar a otro. 
Todas estas cuestiones surgirán cuando examinemos la relación entre el 
conocimiento y la recepción de información. 

No obstante, espero que en este capítulo se haya dicho lo suficiente 
para hacer plausible la afirmación de que nuestra caracterización teórica 
del contenido informativo de una señal nos proporciona una idea clara- 
mente definida que cuadra sorprendentemente bien con nuestra concep- 
ción intuitiva de la información. Nuestra definición no sólo proporciona 
un concepto de información que cumple las exigencias cuantitativas de la 
teoría de la comunicación, sino que también explica la importancia cogni- 
tiva de la información poniendo de manifiesto la naturaleza de la conexión 
existente entre la información y la verdad; nos permite entender la fuente 
(la intencionalidad de las leyes de la naturaleza) del carácter semántico de 
la información,” y revela hasta qué punto, y por qué, la información que 





62 Cuando sugiero que la información cuenta como concepto semántico en virtud de su 
carácter intencional no pretendo decir que las propiedades semánticas de la información sean 
las mismas que las de, por ejemplo, el significado. Como veremos en la tercera parte, la 
intencionalidad del concepto de significado es de un orden superior al de la intencionalidad 
del concepto de información, y esta intencionalidad de orden superior le confiere un conjunto 
de características semánticas distintas. Aunque seguiré insistiendo en la distinción entre el 
concepto de significado y el concepto de información, veremos más adelante que el concepto 
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se recibe está en función de lo que ya se sabe. Ahora queda por mostrar 
cómo la información, tal como se entiende teóricamente, nos ayuda a en- 
tender la idea común de que la información es algo que hace posible el 
aprendizaje, algo que se necesita para conocer. Esa es la tarea de la se- 
gunda parte. 





de información es más fundamental que el de significado. El significado se genera por la 
forma en que se codifica la información. 
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SEGUNDA PARTE 


CONOCIMIENTO Y PERCEPCIÓN 
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4. El conocimiento 


¿Qué es el conocimiento? Una respuesta tradicional es la de que el co- 
nocimiento es una forma de creencia verdadera y justificada. Saber que s 
es F es estar completamente justificado en la creencia (verdadera) de que 
ses F. Normalmente, esas condiciones se interpretan como si fueran inde- 
pendientes entre sí. Las creencias pueden ser falsas, y lo que es verdad 
puede no ser creído. Además, alguien puede estar completamente justifi- 
cado al creer que s es F sin que s sea F (en este caso es obvio que no lo 
sabe) y tener una justificación completa para algo sin creer en ello. 

Esta explicación ortodoxa, aunque se utilice todavía como piedra de 
toque en ciertos argumentos epistemológicos, ya no se considera satisfac- 
toria. Debemos, o bien abandonarla, o bien matizarla en muchos de sus 
extremos para poder solventar multitud de objeciones que la privarían de 
todo poder explicativo. Aunque dejemos a un lado tales objeciones, el aná- 
lisis continúa siendo incompleto, en la medida en que deja sin analizar el 
concepto de justificación. No sirve de nada decir que el conocimiento de- 
pende de tener justificación adecuada si, como sucede tan a menudo, no se 
nos dice qué constituye una justificación adecuada.** 

Me propongo sustituir esta explicación tradicional por otra basada en 
una teoría de la información. Este capítulo es el primer paso en tal sentido. 
Lo que sigue es una caracterización del conocimiento en términos de in- 
formación y creencia. Aunque más adelante (tercera parte) la misma creen- 
cia será descompuesta en sus componentes informativos, utilizaré este 





63 El concepto de justificación (o alguna noción epistémica parecida) se considera una no- 
ción primitiva. Otros conceptos (incluyendo el de conocimiento) se definen por tanto sobre 
esta base primitiva. Dado que no se nos ofrece ninguna guía, o muy poca, para determinar si 
el término primitivo es válido en una situación o no, nos vemos obligados a consultar nuestras 
intuiciones sobre si alguien está lo suficientemente justificado para saber algo y cuándo lo 
está. Desde luego, el resultado es que nos apoyamos en nuestras más firmes intuiciones sobre 
si alguien conoce algo, y cuándo, para determinar si alguien tiene un nivel de justificación 
satisfactorio. Véase, por ejemplo, el tratamiento de Chisholm en Theory of Knowledge, se- 
gunda edición, Englewood Cliffs, N.J., 1977; también Marshall Swain, «An Alternative 
Analysis of Knowing», Synthese, vol. 23 (1972), págs. 423-442. 
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concepto por ahora como un recurso auxiliar para resumir y posponer al- 
gunas cuestiones que sólo pueden tratarse más adelante. 

Cuando existe una cantidad positiva de información asociada al hecho 
de que s sea F,* 


K sabe que s es F = la creencia de K de que s es F está causada (o causalmente 
mantenida) por la información de que ses F. 


Debe subrayarse desde un primer momento que intentamos caracteri- 
zar lo que podríamos denominar conocimiento perceptivo, es decir, cono- 
cimiento sobre un elemento s que es seleccionado o determinado por fac- 
tores diferentes a lo que de hecho K sabe (o cree) saber sobre él. Esto es, 
de acuerdo con nuestra discusión sobre los contenidos informativos de re 
en el último capítulo, estamos interesados en el conocimiento de que algo 
es F, cuando eso que sabemos que es F está fijado por factores perceptivos 
(no cognitivos). Discutiremos, en el próximo capítulo, la naturaleza del 
objeto de la percepción: lo que vemos, oímos u olemos. Allí se argumen- 
tará que el objeto de la percepción es, por decirlo de algún modo, el focus 
de las relaciones de información que se dan entre el sujeto y las fuentes de 
las que él o ella recibe la información. Pero, hasta clarificar este extremo, 
debo solicitar del lector que entienda s como algo que K percibe, algo en 
una fuente de información sobre la que K recibe información. Si K tiene 
una creencia sobre tal objeto, la creencia de que es F, tal creencia se cali- 
fica de conocimiento si y sólo si está causada (o causalmente mantenida) 
por la información de que es F-. 

El análisis puede parecer circular. El conocimiento es identificado con 
la creencia producida (o mantenida) por la información, pero la informa- 
ción que una persona recibe (capítulo 3) es relativa a lo que ya conoce 
sobre las posibilidades de la fuente informativa. Dado que existe una refe- 
rencia encubierta al conocimiento en la parte derecha de la ecuación (disi- 
mulada tras la idea de información) la ecuación no nos dice, como pre- 
tende, lo que es el conocimiento. Más bien, en el uso que hace del concepto 





64 La restricción a situaciones con las que está asociada una cantidad de información posi- 
tiva es una forma de restringir el análisis a lo que podría llamarse conocimiento empírico, es 
decir, conocimiento de estados de cosas que podrían haber sido de otra forma (para los que 
existen alternativas posibles). Sobre nuestro conocimiento de verdades necesarias, tendré 
algo más que decir más adelante. 
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de información, ya presupone que comprendemos lo que es el conoci- 
miento. 

Esta objeción pasa por alto el carácter recursivo de nuestra ecuación. 
Que una persona aprenda que s es F' puede depender de lo que además 
conozca sobre s, pero no depende, y no se dice que dependa, de que co- 
nozca que s es F. Consideramos, por ejemplo, nuestro juego de las con- 
chas. Se sabe que el cacahuete está debajo de una de las cuatro conchas. 
El investigador ya ha examinado las dos primeras y ha descubierto que 
estaban vacías. Dado lo que sabe, quedan sólo dos posibilidades. Cuando 
le da la vuelta a la tercera y descubre que está vacía, la observación lleva 
la información de que el cacahuete está bajo la cuarta concha (capacitán- 
dole con ello a aprender dónde está el cacahuete) a causa de lo que ya 
sabe sobre las dos primeras conchas. Si estamos intensados en si sabe real- 
mente que las dos primeras conchas están vacías, podemos aplicar de 
nuevo esta fórmula a este segmento distinto de conocimiento. La observa- 
ción de la primera concha, ¿llevaba la información de que estaba vacía? Si 
lo hizo, y esta información fue la causa de que creyera que estaba vacía, 
sabe que la concha está vacía. Lo mismo ocurre con la segunda. Si esta 
información (que la primera de la conchas está vacía y la segunda también 
lo está) depende, a su vez, de algo que el investigador ya sabe, podemos 
continuar aplicando la fórmula a ese conocimiento colateral. En último 
término, llegamos a un punto en el que la información recibida no depende 
de ningún conocimiento previo sobre su fuente, y esto es lo que, de hecho, 
permite que nuestra ecuación evite la circularidad. 

¿Qué se quiere decir cuando se afirma que una creencia es causada (o 
causalmente mantenida) por una información determinada? ¿Cómo puede 
ser causalmente eficaz algo tan abstracto como la información? 

Supongamos que una señal r lleva la información de que s es F y lleva 
esa información en virtud del hecho de que tiene la propiedad FF”. Es decir, 
la responsabilidad de que r transporta esta específica información recae en 
el hecho de que r sea F' (no, por ejemplo, en el hecho de que sea G). No 
cualquier golpe en la puerta le dice al espía que ya ha llegado el mensajero. 
La señal son tres golpes rápidos seguidos por una pausa y otros tres golpes 
rápidos. Es esta secuencia la que transporta la vital información de que el 
mensajero ya ha llegado. Ni el tono ni el timbre del sonido producido es 
lo que importa. Tampoco lo es el momento del día en que se producen los 
golpes. Es la sucesión temporal de los golpes la que constituye el rasgo 
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que lleva información (F”) de la señal. Lo mismo es obviamente verdadero 
en el caso de la comunicación telegráfica. 

Cuando, por lo tanto, una señal lleve la información de que s es F'en 
virtud de tener la propiedad FF”, es decir, cuando sea el hecho de que la 
señal es F”, lo que lleve la información (y sólo en ese caso) diremos que la 
información de que s es F' causa todo lo que el hecho de que la señal sea 
F causa. De modo que, por ejemplo, si determinados intervalos entre los 
golpes (los intervalos que llevan la información de que el mensajero ha 
llegado) son la causa del pánico del espía, diremos que la información de 
que ha llegado el mensajero es la causa del pánico del espía. Si, por otra 
parte, es un mero golpe en la puerta el que causa el pánico del espía (dos 
golpes rápidos habrían tenido el mismo resultado), la información de que 
el mensajero ha llegado no es la causa del pánico. De un modo semejante, 
si la causa de que el espía crea que el mensajero ha llegado son los deter- 
minados intervalos entre los golpes, su creencia está causada o producida 
por la información de que el espía ha llegado. Si la creencia es meramente 
el resultado de algunos golpes en la puerta (no siendo en absoluto perti- 
nente la estructura de su secuencia), aunque el espía crea que el mensajero 
ha llegado, y aunque esa creencia sea producida por el hecho de que el 
mensajero golpee la puerta, no ha sido producida por la información de 
que el mensajero ha llegado.* 

Doy por sentado que decir que los sucesos tienen ciertos efectos en 
virtud de tener ciertas propiedades es suficientemente claro. Aunque una 
sustancia pueda disolverse en un líquido, es posible que no sea el carácter 
líquido del disolvente el responsable causal del efecto. La sustancia se di- 
suelve en el líquido en virtud de que el líquido es un ácido, no en virtud de 
que se trata de un líquido. De un modo semejante, un objeto volante puede 
romper un cristal, pero no es el hecho de que vuele aquello en virtud de lo 





65 Hay que darse cuenta de que, aunque la información de que s es G está incluida (nómica 
o analíticamente) en el hecho de que los s son F (de la misma forma que la información de 
que ha llegado alguien está incluida en la información de que el mensajero ha llegado), no se 
sigue que si la información de que s es F causa E, entonces la información de que s es G 
también causa E. Y ello porque el rasgo de la señal que lleva la información de que el men- 
sajero (en particular) ha llegado puede causar E sin que el rasgo de la señal que lleva la 
información (menos específica) de que alguien ha llegado cause E. Esto es decir simplemente 
que el hecho de que algo es cuadrado, por ejemplo, puede producir un efecto particular sin 
que sea verdad decir que el hecho de que tenga ángulos rectos tuvo ese efecto. 
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cual produce tal efecto. Las bolas de algodón cuando vuelan no producen 
ese efecto. Lo que causa que se rompa el cristal es que el objeto tenga 
cierto momentum (masa y velocidad combinadas). La causa explicativa de 
la rotura no es el hecho de que el objeto posea momentum, sino el hecho 
de que posea un momentum lo suficientemente grande. Con ello no se 
quiere decir que el que un objeto golpeara el cristal no causara su rotura. 
Por supuesto, lo hizo. Pero lo que hizo que el golpe del objeto rompiese el 
cristal, no es el que fuera producido por un objeto (es decir, algo con una 
masa), ni el que éste golpeara (con cierta velocidad) el cristal, sino el que 
golpeara el cristal con una combinación suficientemente grande de masa y 
velocidad. Por eso los ladrillos que vuelan rompen ventanas, pero no las 
hojas de los árboles cuando caen.* 

Es un tanto más difícil explicar lo que se quiere con una información 
que sustenta causalmente una creencia. La razón por la que se incluye esta 
calificación parentética en la caracterización del conocimiento es el poder 
capturar un hecho obvio sobre el conocimiento y la generación de la creen- 
cia, o sea, el hecho de que una persona puede saber que s es F sin que su 
creencia haya sido causada, o producida en modo alguno, por medios dig- 
nos de confianza. Por poner un ejemplo, supongamos que K cree que s es 
una F porque un charlatán ignorante se lo dijo. El charlatán ignorante no 
sabe nada sobre aquello de lo que habla, pero K, que no se da cuenta de 
ello, le cree. Tras adquirir esa creencia, K emprende un examen de s y 





66 Dado que la misma información puede transmitirse en una gran variedad de señales físi- 
camente diferentes, existe la posibilidad de que no haya una explicación causal fácilmente 
disponible del efecto de una señal en términos de sus propiedades físicas (las propiedades 
que llevan la información). Puede que tengamos que apelar a la información contenida en la 
señal para explicar sus efectos. Por ejemplo, incluso si lo que causa E es que la señal tenga 
la propiedad física P (que lleva la información de que s es F), una señal que posea la propie- 
dad O, RoS (llevando la misma información) podría tener también este mismo efecto. Por 
tanto, si queremos expresar qué hay de especial sobre estas señales físicamente diferentes 
(una visual, una acústica, una táctil) que explique su efecto común (por ejemplo, la creencia 
de que s es E), puede que no tengamos más alternativa que describir su contenido informativo 
común. 

Conforme examinamos sistemas procesadores de información de creciente complejidad, 
sistemas con la capacidad de extraer la misma información desde una amplia variedad de 
estímulos físicos, deviene más y más natural describir los efectos en términos de la informa- 
ción respecto a la que son una respuesta. Las propiedades físicas de la señal, aquellas propie- 
dades que llevan la información, se retiran de la representación. Estas posibilidades son exa- 
minadas con mayor detalle en la tercera parte. 
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observa que es F (es decir, llega a conocer que es F a través de la percep- 
ción). En un caso semejante, K sabe que s es F (habiendo observado que 
lo es), pero su creencia de que s es F no fue causada o producida por la 
información de que s es F. Más bien, tal creencia fue causada o producida 
por las aseveraciones del ignorante charlatán, que carecían de la informa- 
ción pertinente. Si decimos que K (ahora) lo sabe no es porque su creencia 
fuera causada desde el principio por la información pertinente, sino porque 
su creencia se ve (ahora) mantenida o sustentada por la información per- 
tinente (obtenida a través de su observación de s). 

Espero que este ejemplo le proporcione al lector una idea intuitiva del 
tipo de caso al que nos referimos cuando hablamos de una información 
que mantiene causalmente una creencia. Es como añadir una segunda 
cuerda para aguantar un objeto que ya está suspendido de una primera 
cuerda. El objeto está ahora sostenido por dos cuerdas. Ambas soportan el 
mismo peso. Sin embargo, ninguna de las dos cuerdas (por sí misma) es 
necesaria dado que la otra cuerda es (por sí misma) suficiente. En tal caso 
no podemos decir que la segunda cuerda está sosteniendo el objeto; al me- 
nos, no si interpretamos eso como entrañando que, si la apartáramos, caería 
el objeto. Dado que, por supuesto, si apartáramos la segunda de las cuer- 
das, la primera volvería a tomar su anterior papel como la única que sos- 
tiene el objeto. 

Lo que debemos decir de la segunda cuerda es que ayuda a sostener el 
objeto y que es suficiente para sostenerlo. Tiene un efecto sobre el objeto 
y, además, el tipo de efecto que bastaría, en ausencia de otros medios de 
sostenimiento, para la existencia del efecto (la suspensión), Es así, por lo 
menos, como propongo que se entienda una causa sustentadora. La creen- 
cia de K de que s es F está causalmente sustentada por la información de 
que ses F si y sólo si esta información afecta a la creencia de un modo tal 
que bastaría, en ausencia de la contribución de otras causas, para la exis- 
tencia de la creencia. La información debe tener un papel similar al de la 
segunda de las cuerdas en el ejemplo anterior. La creencia de K de que s 
es F se califica de conocimiento en la medida en que la observación por 
parte del sujeto hubiera producido la creencia en ausencia de las asevera- 
ciones del charlatán ignorante. Si suponemos que K no habría confiado en 
su observación sin las previas aseveraciones del charlatán (que no habría 
creído que s es F sobre la base de su mera observación), la observación no 
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sustenta causalmente la creencia en el sentido requerido (no es suficiente 
por sí misma para la creencia) y K no sabe (en tal caso) que s es F. 

Esta definición (la de una cosa que sustenta causalmente a otra) tiene 
deficiencias técnicas de las que soy consciente. Sin embargo, no sé qué 
motivos podrían darse para la investigación de una solución técnica, y mu- 
cho menos para su descubrimiento sin una digresión tediosa sobre la natu- 
raleza de las relaciones causales, la suficiencia causal, la sobredetermina- 
ción y los contra-fácticos. Me propongo, por tanto, conformarme con lo 
que ya tengo. Nos permite decir de alguien que recibe la información per- 
tinente después de tener la creencia que, a pesar de ello, sabe, en la medida 
en que esta creencia esté basada del modo apropiado en la nueva informa- 
ción, es decir, en la medida en que la nueva información sustente causal- 
mente la creencia como la segunda de las cuerdas ayudaba a sostener el 
objeto.*” 

Debe quedar claro, a partir de tales ejemplos, que una creencia que está 
causada (o causalmente sustentada) por la información de que s es F puede 
no incorporar ella misma la información de que s es F. El que la creencia 
de K de que s es F transporte la información de que s es F depende de las 
otras cosas que (además de la información de que s es F) puedan causar 
que K lo crea. En el ejemplo anterior, una señal sin la información de que 
ses F (o sea, las afirmaciones del charlatán ignorante) fue la causa de que 
K creyera que s era F. K se dio cuenta más tarde de que s era F por medio 
de la observación. En ese caso, su creencia de que s es FF (tras haberlo 
observado) se califica de conocimiento, por más que no transmita por sí 
misma la información de que s es F. No lleva esa información porque cier- 
tas señales sin esa información son capaces de causar [de hecho, causaron) 
esta creencia. No cualquiera que sabe que s es FF es alguien del que es 
posible aprender que s es F. El que podamos aprender de K que s es F 
depende, no sólo de que K sepa que s es F, sino también de las otras cosas 
(además de la información de que s es FF) que puedan inducir la creencia 
en K. K no es un informador digno de confianza aunque sepa. En realidad, 





67 Para algunos ejemplos ingeniosos que ilustran las dificultades técnicas en la formulación 
de una definición satisfactoria, en líneas generales, de causa sustentadora, véase Keith Leh- 
rer: Knowledge, Clarendon Press, Oxford, 1974, págs. 122-126. Para un intento de superar 
algunas de estas dificultades, véase Marshall Swain, «Reasons, Causes and Knowledge», The 
Journal of Philosophy, vol. 75, n? 5, mayo 1978, pág. 242. Mi explicación se parece a la de 
D. M. Armstrong en Belief, Truth and Knowledge, Cambridge, 1973, págs. 164 y siguientes. 
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ésta es la razón por la que no es posible definir el conocimiento de que s 
es F como una creencia (que s es F) que lleva esta información, dado que 
algunas creencias que cuentan como conocimiento no llevan la informa- 
ción relevante.* 

La idea de una información que causa (o que sostiene causalmente) una 
creencia pretende captar lo que es valioso en la doctrina de que para que 
la creencia de alguien cuente como conocimiento, no sólo debe haber evi- 
dencia que la apoye, sino que la creencia debe estar basada en tal eviden- 
cia. En tanto en cuanto la información de que s es F cause la creencia de K 
de que s es F, podemos decir que la creencia está basada en la información 
de que ses F. 

Es importante advertir que esto no es una explicación del conocimiento 
perceptivo como conocimiento inferencial. Si K ve que s se mueve y que, 
a resultas de ello, adquiere la creencia de que s se está moviendo, no nece- 
sitamos suponer que esta creencia se alcanzó por medio de alguna forma 
de inferencia. El estado sensorial de K (lo que se requiere para que vea que 
s se mueve) puede incorporar la información de que s se está moviendo, y 
esta información puede ser la causa de que K crea que se está moviendo 
sin que K tenga ninguna creencia sobre su propio estado sensorial. Su 
creencia está basada en (esto es, es causada por) la información sensorial 
que recibe, pero no es necesario (aunque sea posible) que K crea algo sobre 
las propiedades intrínsecas de su estado sensorial, aquellas propiedades 
que llevan la información sobre s. No es necesario que K crea, por ejemplo, 
que está teniendo algún tipo de experiencia sensorial, que las cosas se le 
aparecen en cierto modo o que parecen ser de tal o cual forma (enten- 
diendo éstas como creencias sobre el llamado carácter «fenoménico» de 
su experiencia). Son, por supuesto, las propiedades intrínsecas del estado 
sensorial (aquellas que llevan la información de que s se está moviendo) 





68 Creo que ése es uno de los defectos en el análisis del conocimiento de Armstrong. El 
hecho de que K sepa que s es un perro no significa que podamos aprender de K que s es un 
perro. Porque si K piensa erróneamente que los lobos son perros (y, por lo tanto, creería que 
s es un perro sí fuese un lobo), el conocimiento de K de que s (un teckel, fácilmente recono- 
cible) es un perro no es algo que pueda comunicarnos diciéndonos que s es un perro. Su 
creencia de que s es un perro no lleva la información de que s es un perro. Consultar el análisis 
de Armstrong en Belief, Truth and Knowledge, tercera parte. He tomado prestado el ejemplo 
del perro y el teckel de Alvin Goldman, «Discrimination and Perceptual Knowledge», Jour- 
nal of Philosophy, vol. 73.20 (1976). 
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las que causan que K crea que s se está moviendo, pero, si no se produce 
ninguna creencia interpuesta, la creencia sobre s (que se está moviendo) 
no tiene antepasados causales que sean ellos mismos creencias. La creen- 
cia no tiene ninguna derivación discursiva y, en ese respecto, es adquirida 
directamente y sin que medie inferencia alguna. 

Con estas digresiones preliminares, ya podemos volver a la defensa de 
nuestra caracterización de conocimiento. No obstante, debe advertirse 
desde el principio que no pretende ser una definición de conocimiento, 
algo que podría ser establecido por medio de un análisis de los conceptos 
o por una investigación en el significado de los términos «conocimiento», 
«información», «creencia» y «causa». Representa una coordinación entre 
nuestro concepto ordinario de conocimiento (o mejor, de conocimiento 
perceptivo) y la idea técnica de información que fue desarrollada en la pri- 
mera parte. Es un intento de describir, con los recursos conceptuales de la 
teoría de la información, el estado que en la vida ordinaria se describe por 
medio del verbo «saber». A este respecto, la ecuación es análoga a la re- 
descripción termodinámica de los objetos calientes en términos de su ca- 
pacidad calórica, conductividad y temperatura. Esto no es lo que estar 
caliente significa, pero (hablando en términos de la termodinámica) eso es 
lo que es estar caliente. Por así decirlo, estamos proporcionando un prin- 
cipio puente entre esquemas conceptuales, no una verdad en el seno de 
alguno de esos esquemas. El uso de la palabra «información» ayuda a os- 
curecer la naturaleza interconceptual de nuestra ecuación. Si la palabra es 
interpretada en algún sentido ordinario, como queriendo decir algo similar 
a noticias, inteligencia, instrucción o conocimiento, la caracterización del 
conocimiento como creencia producida por información puede parecer tri- 
vial y poco explicativa. Pero no es así como se usa el término «informa- 
ción». Debe entenderse que el término significa exactamente lo que se dijo 





62 La contrapartida termodinámica a «s está caliente» no pretende ser equivalente en signi- 
ficado al original. Más bien, representa un intento de decir, en términos de conceptos precisos 
pero comparativamente menos familiares, lo que de hecho es verdadero de un objeto cuando 
está caliente (como decimos en la vida ordinaria). El análisis del conocimiento en términos 
de una teoría de la información debiera ser juzgado de la misma forma. La única cuestión 
importante es si lo que está en el lado derecho de la ecuación teórica es verdadero cuando, y 
sólo cuando (dejando aparte excepciones que pueden ser explicadas), lo que está en el lado 
izquierdo es verdadero (y, por supuesto, la cuestión de si existen razones para pensar que esta 
equivalencia no es accidental). 
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que significaba en la definición del contenido informativo de una señal del 
capítulo 3. Bajo esta interpretación, nuestra caracterización del conoci- 
miento en base, a la teoría de la información es una tesis epistemológica 
ni trivial ni obvia. Muy al contrario. 

En tal caso, ¿qué puede decirse en apoyo de la idea de que el conoci- 
miento es creencia producida por información? Lo que sigue es un intento 
de poner en juego los argumentos en favor de esta ecuación teórica, en 
particular, los argumentos en favor de la necesidad de la información. Más 
adelante (cap. 5) examinaremos algunas posibles objeciones. 


Los juicios habituales 


Una forma de determinar si Y es necesario para X, cuando hay formas 
independientes de determinar la presencia del uno y del otro, es seleccionar 
un número de situaciones diferentes para ver si X se da alguna vez sin Y. 
Si lo hace, con ello se decide la cuestión: Y no es necesario para X. Si no, 
dependiendo del tamaño de la muestra y la variedad de las situaciones exa- 
minadas, tendremos razones inductivas para concluir que (probablemente) 
Y es una condición necesaria para X. 

Esta estrategia puede emplearse en el presente caso sólo si tenemos 
medios independientes para determinar cuándo alguien sabe algo. Dado 
que es obvio que carecemos de criterios claros y bien determinados en este 
campo (de otro modo estarían de más los esfuerzos filosóficos como el 
presente), estamos obligados a confiar en los juicios comunes e intuitivos. 
Por supuesto, puede haber discrepancias respecto a ciertos casos, y cuando 
suceda tal cosa el método no será concluyente. Pero si hay un conjunto de 
casos claros —al menos, claros para el juez sin prejuicios teóricos— pue- 
den utilizarse para comprobar la hipótesis. Dependerá de nuestro propio 
acuerdo o desacuerdo con la selección intuitiva de la que depende el resul- 
tado el que encontremos a éste más o menos convincente. 

Podemos comenzar citando los ejemplos usados en los capítulos ante- 
riores. En cada uno de los casos en los que las señales que llegaban al 
sujeto carecían de la información pertinente (tal y como fue definida en el 
capítulo 3), juzgaríamos, basándonos en nuestras intuiciones, que el sujeto 
no sabe. Cuando el mensajero perdió la nota y redactó una nueva con el 
nombre de «Herman», ésta llevaba una información nula sobre quién había 
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sido seleccionado por los empleados. Por lo tanto, no llevaba la informa- 
ción de que Herman había sido seleccionado y es obvio que, independien- 
temente de lo que el jefe fuera inducido a creer por la recepción de la nota, 
no sabía que Herman era el elegido (no si la única comunicación pertinente 
fue la nota cambiada llevando el nombre de «Herman»). De un modo pa- 
recido, cuando los empleados se pusieron de acuerdo para proteger a Shir- 
ley dando el nombre de Herman si la elegida era ella (y dando el verdadero 
nombre del elegido en caso contrario), el jefe pudo haber adquirido la 
creencia, creencia verdadera, de que el elegido era Herman y la causa de 
que lo creyera pudo haber sido la recepción de la nota con el nombre de 
«Herman, pero no por ello llegó a saber que el elegido era Herman. La 
razón es que la nota no llevaba la información. Por lo que la creencia del 
jefe no pudo haber sido causada por la información de que Herman era el 
elegido. 

Los ejemplos restantes ofrecen el mismo resultado. Decíamos que el 
sujeto, cuando buscaba el cacahuete bajo las conchas, examinaba las con- 
chas 1 y 2 y las encontraba vacías. Es obvio que todavía no sabe dónde 
está el cacahuete. Sólo tras descubrir que la tercera concha está vacía (o un 
cacahuete en ella) se diría que es posible el conocimiento (sobre el para- 
dero del cacahuete). Las dos primeras observaciones no transmiten la in- 
formación de que el cacahuete está bajo la concha 4 y pienso que ésta es 
la base de nuestro juicio de que, en este estadio de la investigación, el su- 
jeto no puede saber dónde está el cacahuete. Todavía no ha recibido la 
información decisiva. 

Puede suponerse que los ejemplos mencionados son inventados y que 
otros menos artificiosos serían menos favorables. Es cierto que los ejem- 
plos han sido inventados, pero no con el propósito de verificar el análisis 
presente. Han sido cuidadosamente escogidos para ilustrar las ideas fun- 
damentales de la teoría de la comunicación. Otros ejemplos serían tan ade- 
cuados como éstos. Consideremos, en concreto, una situación en la que 
alguien podría estar tentado de suponer que el conocimiento es posible en 
ausencia de la información requerida. Hay cuatro posibilidades (R, M, Z y 
V) en la fuente. Son igualmente probables. Llega una señal r que altera del 
siguiente modo la distribución de probabilidades: 


P(RIr) =0,9 
P(MIr) =0,03 
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P(Z/r) = 0,03 
P(VIr) =0,04 


La señal eleva la probabilidad de que s sea R y a la vez disminuye la 
probabilidad del resto de las alternativas posibles. El cálculo muestra que 
la equivocidad de esta señal es 0,6 bits. Lleva sólo 1,4 bits de información 
sobre el estado de s. Por tanto no lleva la información de que s es R aunque 
s sea R. Sin embargo, es posible pensar que alguien pueda aprender de una 
señal semejante que s es R. O, si todavía consideramos que la probabilidad 
de que s sea P es demasiado baja para contar como conocimiento, podemos 
elevarla a 0,99 y disminuir las probabilidades de sus competidoras a 0,003, 
0,003 y 0,004, respectivamente. Incluso entonces la señal no consigue lle- 
var la información de que s es R, dado que todavía queda una cantidad 
positiva de equivocidad. Sin embargo, seguramente habrá alguna proba- 
bilidad suficientemente grande de que s sea R (menor que 1) que nos per- 
mitirá saber que s es R. Algo así parece que podría defenderse. 

Aquí las intuiciones comienzan a discrepar. El uso de este método para 
comprobar nuestra ecuación teórica puede parecer, por tanto, de poca fia- 
bilidad. Lo mejor que puedo hacer es exponer mi propio punto de vista al 
respecto. Consideremos un caso que ejemplifica el conjunto anterior de 
probabilidades condicionales. Extraemos una bola de una urna que con- 
tiene 90 bolas rosas (R), tres amarillas (M), tres azules (Z) y cuatro verdes 
(V). Dado que las estábamos extrayendo al azar de una urna con esta dis- 
tribución relativa de bolas de color, la probabilidad relativa de extraer una 
bola rosa es 0,9, la de extraer una bola amarilla es 0,03, y así sucesiva- 
mente. Supongamos que K recibe un mensaje conteniendo la información 
de que sacamos al azar una bola de una urna con esta distribución de bolas 
de color (por ejemplo, observa cómo la extrajimos de una urna acerca de 
la que sabe, por su previa inspección, que tiene esa composición de bolas 
de color). Suponiendo que, de hecho, hubiésemos extraído una bola rosa, 
¿sabe K que lo hicimos así? ¿Puede saber que lo hicimos si toda su base 
es el hecho de que la sacamos al azar de esa urna? Podemos suponer que 
cree que extrajimos una bola rosa. Puede estar absolutamente seguro de 
ello. Además, su creencia es correcta. Pero seguimos aún sin responder a 
la pregunta: ¿lo sabe? Me parece obvio que no. Puede ser razonable que lo 
crea (o que apueste por ello), pero no está en la situación de alguien que 
ha echado un vistazo al color de la bola que sacamos (que ha visto que era 
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rosa). Si intentáramos engañar a K diciéndole que elegimos una bola ama- 
rilla, no podría, a diferencia de la persona que vio la bola, saber que está- 
bamos mintiendo. Y no hay un cambio significativo en esta situación si 
elevamos la proporción relativa de bolas rosas. En la medida en que la 
información está ausente, como lo estará siempre que haya bolas de otro 
color en la urna, el conocimiento no es posible.” 

Las mismas intuiciones funcionan en contextos más ordinarios. El pe- 
rro de un vecino huye con los bistecs que K está asando en el patio trasero 
de su casa. K llega a vislumbrar al perro con los bistecs entre los dientes. 
Con esta breve observación, tenemos la suficiente información como para 
identificar al perro como un perro de caza. Ahora bien, es de esperar que 
si tienes el único perro cazador del vecindario te encuentres con K a la 
puerta de tu casa insistiendo en que es tu perro el que le robó su bistecs. Si 
lo sabe o no puede ser discutible (¿vio realmente los bistecs en la boca del 
perro?), pero hay algo que parece bien claro. Si hay otro perro de caza en 
el vecindario, habitualmente atado, pero que de vez en cuando se encuentra 
libre para sus correrías, K no sabe, a pesar de su protesta, que tu perro es 
el culpable. Puede que esté en lo cierto al pensar que fue tu perro, pero una 
investigación detenida revelaría que no sabe que no fue el otro perro. Des- 
pués de todo, el otro perro, aunque está atado habitualmente, tiene a veces 
la libertad de correr libremente. Si K se preocupa en hacer las averiguacio- 
nes oportunas, puede adquirir la información de que el otro perro estaba 
atado en el momento del incidente. Tras recibir esa información, podemos 
decir de él que entonces sabe que es tu perro el que se llevó sus bistecs. 
Pero este juicio no hace más que confirmar las restricciones que impone la 
teoría de la información. Puesto que las dos informaciones, la visual y la 
(supongamos) acústica, conjuntamente consideradas, contienen la infor- 
mación de que fue tu perro el que corría con los bistecs, información que 
ninguna de las dos señales, considerada por sí misma, contiene. 

No espero un acuerdo universal sobre la manera en que he descrito 
estos casos. Puede haber honestas diferencias de opinión sobre la cuestión 





70 Mi propio sondeo, informal y altamente acientífico, entre filósofos indica que la opinión 
común es que no sabemos que la bola es rosa si existe alguna bola no rosa en la urna de la 
que se ha hecho la selección. Este es mi propio punto de vista, lleno de prejuicios teóricos, 
sobre el asunto. Otros filósofos, con diferentes prejuicios teóricos, han juzgado estos casos 
de modo diferente. 
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de si un individuo (como K en los últimos ejemplos) sabe o no sabe lo que 
se dice que sabe o no sabe. Tenemos bien poco que ganar si tratamos de 
hacer cuadrar las intuiciones en los casos conflictivos. Un pájaro blanco 
no es un caso crucial para la hipótesis de que todos los cuervos son negros 
si los investigadores no pueden ponerse de acuerdo en si el pájaro es o no 
un cuervo. Cuando el desacuerdo persiste, lo único razonable que podemos 
hacer es o bien buscar otros ejemplos, en los que el acuerdo sea posible, o 
bien acudir a consideraciones más sistemáticas y generales que apoyen la 
validez de la hipótesis en cuestión. Me propongo hacer esto último en el 
resto del presente capítulo. Lo que sigue son sólo algunas consideraciones 
teóricas en favor de una teoría del conocimiento basada en la información. 
El siguiente capítulo examinará algunos de los más serios argumentos con- 
tra tal tipo de análisis, y en particular los que se relacionan con la posibi- 
lidad de recibir información del tipo requerido y, por tanto, la posibilidad 
de conocer algo sobre una fuente independiente. Volveremos a los ejem- 
plos más tarde. 


El problema de Gettier 


En un conocido artículo que ha sido ampliamente discutido, Edmund 
Gettier da dos ejemplos que pretenden mostrar que el conocimiento no es, 
o no es meramente, creencia verdadera y justificada.”! Muchos filósofos 
han encontrado convincentes esos ejemplos. Por tanto, vale la pena men- 
cionar como un extremo en favor del punto de vista que defiendo que las 
dificultades del tipo Gettier no pueden plantearse contra un análisis que 
haga del conocimiento algo condicionado a la recepción de información. 

Los ejemplos de Gettier se concibieron para ser aplicados a los análisis 
en los que el sentido de «justificado» era tal que alguien podría estar jus- 
tificado al creer algo falso. Si se considera el conocimiento como una 
forma de creencia verdadera justificada, y la justificación requerida para 
este tipo de conocimiento es falible (es decir, uno puede estar justificado, 
en ese sentido, a creer algo que es falso), este punto de vista sobre el co- 
nocimiento tiene una grave deficiencia. Ya que, en ese sentido, es posible 
estar justificado para creer algo que es verdad sin que eso cuente como 





11 «Is Justified True Belief Knowledge?», Analysis, vol. 23 (1963), págs. 121-123. 
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conocimiento. Supongamos que K está justificado al creer que hay una 
ficha en la casilla 2 de un tablero de damas, pero que, de hecho, la ficha 
está en la casilla 3. Si suponemos que K llega a la creencia de que la ficha 
está o bien en la casilla 2 o bien en la casilla 3 sobre la base de su creencia 
justificada de que está en la casilla 2, y damos por sentado que la justifi- 
cación es heredada por las consecuencias lógicas conocidas de lo que al- 
guien está justificado para creer, la creencia de K de que la ficha está en la 
casilla 2 o en la casilla 3 no sólo es verdadera, sino que está justificado 
para adoptarla. Sin embargo, es obvio que no lo sabe. Este ejemplo (una 
adaptación del segundo caso de Gettier) revela que no es suficiente creer 
justificadamente algo verdadero. Dado que la verdad de lo que alguien cree 
puede no tener relación con las razones (justificación) para creerlo. 

El análisis que defiendo es inmune a tales dificultades. Tal inmunidad 
se deriva del hecho de que no es posible recibir la información de que s es 
F cuando s no es F.. K (en el ejemplo anterior) no recibió ningún mensaje 
conteniendo la información de que la ficha estaba en la casilla 2 porque no 
estaba en ella. Puede haber recibido suficiente información sobre la loca- 
lización de la ficha como para estar justificado en la creencia de que estaba 
en la casilla 2, pero no puede haber recibido la información de que estaba 
en ella. Por lo tanto, incluso si aceptamos el principio de que K está justi- 
ficado para creer todo lo que sabe que es una consecuencia lógica de lo 
que está justificado para creerlo,”? lo más que podemos inferir es que K 
está justificado para creer que la ficha está en la casilla 2 o en la casilla 3. 
No podemos llegar a la conclusión de que la creencia verdadera y justifi- 
cada de K (que la ficha está en la casilla 2 o en la casilla 3) constituye 
conocimiento. Y no podemos llegar a ella porque no se nos ha dicho si K 
ha recibido la información de que la ficha está en la casilla 2 o en la casilla 
3, algo que, en el presente análisis, es necesario para que sepa. 

Cabe, por supuesto, la posibilidad de que K reciba la información de 
que la ficha está en la casilla 2 o en la casilla 3 (pero ni la información de 





72 Este «principio» es una modificación del que Gettier formula y usa en la construcción de 
sus contraejemplos. Su versión propia es : «para toda proposición P, si S está justificado en 
creer P, y Pimplica O, y S deduce O desde P y acepta O como un resultado de esta deducción, 
entonces S está justificado en creer O.» He criticado la validez general de este principio 
[«Epistemic Operators», The Journal of Philosophy, vol. 67, n? 24, diciembre 24, 1970], pero 
los problemas asociados con su validez general no afectan al tipo de caso que se discute en 
el texto. 
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que está en la casilla 2 ni la información de que está en la casilla 3) y llegue 
a la creencia (equivocada) de que está en la casilla 2 sobre la base de esa 
información. No sabe que está en la casilla 2, pero podemos suponer que 
está justificado para creerlo (el mensaje que recibió puede haber conver- 
tido en algo muy probable el que la señal estuviera en la casilla 2). Enton- 
ces, K infiere que la ficha está en la casilla 2 o en la casilla 3. Tiene ahora 
una creencia verdadera y justificada («verdadera» porque la ficha está en 
la casilla 2 o en la casilla 3), pero tal creencia ha sido derivada de la creen- 
cia falsa de que la ficha estaba en la casilla 2. Dado que K ha recibido la 
información de que la ficha estaba en la casilla 2 o en la casilla 3, ¿pode- 
mos concluir (de acuerdo con el presente análisis) que sabe que la ficha 
está en la casilla 2 o en la casilla 3? 

Si un sujeto recibe una señal que contiene la información de que s es 
H (por ejemplo, F o G) y, sobre la base de este mensaje, llega a la falsa 
creencia de que s es F, podemos decir inmediatamente que no sabe que s 
es F. Pero, si el sujeto llega a creer después que s es H (por ejemplo, Fo 
G) sobre la base de su creencia de que es F, ¿lo sabe o no lo sabe? No hay 
ninguna respuesta general a esta cuestión. Necesitamos más detalles sobre 
la particularidad de cada caso.”? Ya que lo crucial es precisamente cómo 
la (falsa) creencia interpuesta aparece en la generación de la (verdadera) 
creencia resultante. Supongamos que observo que estás fumando lo que yo 
tomo por puros (de hecho, se trata de cigarrillos muy gruesos y de color 
marrón). Más tarde, cuando alguien pregunta si tú fumas o no, recuerdo 
haberte visto fumar (lo que erróneamente tomé como) puros y contesto 
«Sí, fuma». ¿Sé que tú fumas? ¿Sé que alguien se fue pronto de la fiesta si 
llego a esta conclusión (verdadera) a partir del hecho, o de lo que yo con- 
sideré como el hecho, de que Betty se fue pronto de la fiesta? Si estoy 
equivocado al creer que era Betty la que se iba pronto (la mujer que vi salir 
era sólo muy parecida a Betty), ¿estoy por ello descalificado en mi creen- 
cia de que alguien se fue pronto? Obviamente, no. Todo depende de lo que 





73 Al considerar tales ejemplos, William Rozeboom concluye, pienso que correctamente, 
que «cuando la creencia verdadera justificada p de una persona es acompañada por una creen- 
cia falsa justificada q, puede que resulta problemático decidir si esta creencia en p está rela- 
cionada con su creencia en q de tal forma que la falsedad de la última debería descalificar a 
la primera como conocimiento.» Ver su «Why I Know So Much More than You Do», Ame- 
rican Philosophical Quarterly, vol. 4, n* 4 (1967); reimpreso en Knowing, Michael D. Roth 
y León Galis (eds.), Nueva York, 1970, pág. 135. 
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causó mi creencia de que alguien se fue pronto. ¿Se trata de la información 
(que recibí al presenciar la temprana salida de uno de los invitados) de que 
alguien se fue pronto? Si es así, incluso aunque esa señal me produzca una 
creencia falsa (que Betty se va pronto), sé que alguien se fue pronto. Esto 
es así porque la influencia causal de la información (de que alguien se fue 
pronto) se produce a través de la falsa creencia interpuesta, convirtiendo a 
esta última en causalmente dispensable. Incluso si es verdad (lo que no 
está completamente claro en mi descripción del caso) que creo que alguien 
se fue pronto porque creo que Betty se fue pronto, no llego a creer que 
alguien se fue pronto sólo porque creo que Betty (en particular) se fue 
pronto. Si descubriera que no fue Betty la que vi yéndose pronto, la creen- 
cia de que alguien se fue pronto no se vería afectada, dado que esta creen- 
cia está (en la situación que estamos imaginando) anclada en la informa- 
ción que recibí al ver a alguien yéndose pronto. Cuando éste es el caso, el 
conocimiento de que ses Hes posible aunque esté producido en asociación 
con una creencia falsa de que s es F. 

Sin embargo, podemos imaginar fácilmente situaciones en las que la 
creencia verdadera resultante no es producida, ni sustentada, por informa- 
ción apropiada. Supongamos que estoy convencido de que nadie se iría 
pronto excepto Betty. Lo que me lleva a creer que alguien se fue pronto no 
son sólo los rasgos de la señal que llevan la información de que alguien se 
va pronto, sino aquellos rasgos que considero (erróneamente) que llevan 
la información de que Betty se va pronto. Si se me dijera que no fue Betty 
la que vi yéndose, abandonaría mi creencia de que alguien se fue pronto 
(la persona en cuestión debe haber salido fuera por alguna razón). En este 
caso, la creencia de que alguien se va pronto no está sostenida causalmente 
por la información de que alguien se está yendo pronto, por más que esta 
información se esté recibiendo. La creencia está causada por los específi- 
cos aspectos de la señal que (erróneamente) considero indicativos de que 
Betty se está yendo pronto. En tal caso, la creencia verdadera resultante no 
se califica de conocimiento. 


La paradoja de la lotería 


Si tienes un boleto de lotería y millones de personas tienen también su 
boleto, hay muchísimas posibilidades de que no ganes. Alguien debe ganar 
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(podemos decir), pero las posibilidades contra la victoria de cualquier per- 
sona en particular son abrumadoras. Sin embargo, aunque la probabilidad 
de que pierdas está muy cercana a la unidad, parece incorrecto decir que 
sabes que vas a perder. Dado que si tú sabes que vas a perder, cualquiera 
de los que tienen un boleto deben ser cualificados de un modo similar, 
puesto que las posibilidades en contra de su victoria son las mismas. Pero 
no todos pueden saber que van a perder, dado que alguien va a ganar. ¿Po- 
demos decir que todos saben que van a perder excepto la persona que va a 
ganar? Parece extraño. Ya que no hay absolutamente nada que pueda di- 
ferenciar al que en última instancia va a ganar de los que en última instan- 
cia van a perder, excepto el hecho de que va a ganar. Él tiene la misma 
evidencia que cualquiera de los demás.?* 

Desde el punto de vista de la teoría de la información, cada uno del 
millón de participantes en la lotería (suponiendo que se trate de una lotería 
justa, en la que cada poseedor de un boleto tiene las mismas oportunidades 
de ganar) está en la misma posición. La cantidad de información asociada 
al hecho de que posea un boleto ganador es casi de 20 bits y la cantidad 
de información asociada al hecho de que posea uno perdedor es casi cero. 
Pero aunque la cantidad de información asociada a que tenga un boleto 
perdedor es muy cercana a cero, no es igual a cero. Por lo que, a menos 
que los participantes tengan una información especial sobre el resultado 
final del sorteo, ninguno de ellos ha recibido la (cuantitativamente) pe- 
queña información que, de acuerdo con el punto de vista sobre el conoci- 
miento que se está defendiendo, es esencial para que sepan que van a per- 
der. Las restricciones sobre el conocimiento que impone la teoría de la 
información explican perfectamente por qué nadie sabe que va a perder en 
una lotería justa.” Todos están justificados para ser pesimistas, pero nadie 
tiene acceso a la información que le permitiría saber que va a perder. 





74 Para una de las primeras discusiones de la «paradoja de la lotería» y sus consecuencias 
para la lógica inductiva, véase H. H. Hyburg, «Probability, Rationality and the Rule of Deta- 
chment», Proceedings of the 1964 International Congress for Logic, Methodology, and Phi- 
losophy of Science, Y. Bar-Hillel (ed.), North Holland, 1965. Véase también Herbert Heidel- 
berg, «Knowledge, Certainty and Probability», Inquiry, vol. 6 (1963). Para una discusión más 
reciente de esta paradoja en su relación con cuestiones epistemológicas, véase D. M. Arms- 
trong, Belief, Truth and Knowledge, Cambridge University Press, 1973, págs. 185 y siguien- 
tes. 


75 Aunque nadie sabe que va a perder, la gente dice muchas veces que sabe que va a perder. 
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Es posible, por supuesto, rechazar el análisis de la teoría de la informa- 
ción sin apoyar el extraño punto de vista de que cada uno (excepto el que 
al final gane) sabe que va a perder.”* Quizás hay concepciones alternativas 
del conocimiento que traten este tipo de casos de un modo igualmente ele- 
gante. Debemos conceder esa posibilidad. Sin embargo, hay un extremo 
relacionado que proporciona, así lo creo, la ventaja decisiva al análisis ba- 
sado en la información. 

Supongamos que el conocimiento no requiere la recepción de informa- 
ción. En ese caso, K puede saber que s es F sin haber recibido la informa- 
ción de que s es F. Supongamos, por tanto, que K sí sabe que s es F sin 
haber recibido esa información. Dado que esto entraña que cualquier señal 
que lleva la información sobre s que Kha podido recibir era equívoca hasta 
cierto grado, er denotará esta cantidad positiva de equivocidad. Suponga- 
mos, además que K sabe que £ es G y que lo sabe sin haber recibido la 
información de que £ es G. Utilizaremos e. para denotar el grado positivo 
de equivocidad de las señales que K ha recibido (si las ha recibido) en 
relación a que t es G. Dado que la equivocidad acumulativa cuando las 
fuentes son mutuamente independientes, la equivocidad total del conjunto 
de señales que K ha recibido sobre s y £ es er + + ea. Preguntémonos ahora: 
dado (por hipótesis) que K sabe que s es F y que £ es G, ¿sabe también que 
ses F y tes G? Es decir, ¿sabe la conjunción de las cosas que (consideradas 
aisladamente) sabe? La equivocidad de la conjunción es mayor que la 
equivocidad de los elementos conjuntados. Y es fácil ver que cuando rea- 





Esto no es más que una expresión de resignación, un intento de eliminar expectativas no 
razonables. Si la gente supusiese realmente que va a perder, su compra del billete de lotería 
sería inexplicable. ¿Por qué apostar dinero por P si sabemos que no-P? 


76 Norman Malcolm casi apoya esta extraña postura en «Knowledge and Belief» (Kno- 
wledge and Certainty, Englewood Cliffs, N.J., 1963) cuando dice: «Como filósofos podemos 
sorprendernos al observar que el conocimiento de que P es verdadera difiere de la creencia 
de que P es verdadera sólo en que en un caso P es verdadera y en el otro falsa. Pero esto es 
un hecho» (pág. 60). Aunque he dicho que Malcolm «casi» apoya este extraño punto de vista, 
es bastante claro que, por lo menos en este pasaje, no lo acepta realmente. Dice que el cono- 
cimiento de que P puede diferir de la creencia de que P sólo con respecto a la verdad de «P». 
No dice que siempre lo haga o que lo haga en situaciones como la que se describe en el 
ejemplo de la lotería. 
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lizamos la conjunción de proposiciones, cada una de las cuales es aislada- 
mente una expresión de lo que K sabe que es el caso, la equivocidad total 
continuará incrementándose. Puede hacerse tan grande como queramos. 
Si uno acepta el principio de que si K sabe que P y sabe que O, sabe 
que P y O (denominemos a éste el principio de conjunción), se verá for- 
zado a dar una respuesta afirmativa a la cuestión anterior. Es decir, K sí 
sabe que s es F y t es G porque sabe que s es F' y sabe que 1 es G. Pero, 
dado nuestro supuesto de partida (que es posible saber sin haber recibido 
la información), tal cosa significa que es posible saber cosas independien- 
temente de cuán grande llegue a ser la equivocidad, independientemente 
de cuánta información se haya perdido entre la fuente y el receptor. Puesto 
que, en la medida en que continuemos conjuntando proposiciones (expre- 
sando cada una de ellas lo que K sabe), la equivocidad del conjunto alcanza 
un punto en el que «echa a pique» cualquier información positiva que se 
esté recibiendo. Para ilustrarlo, consideremos el ejemplo de la lotería. K 
compra un boleto de lotería. Luego se da cuenta de que se han vendido un 
millón más de boletos. La recepción de esta información convierte en abru- 
madora la posibilidad de que K pierda. La cantidad de equivocidad rema- 
nente es despreciable (aunque, por supuesto, no sea cero). Pero lo mismo 
puede afirmarse de los amigos de K que (como luego se demostró) también 
poseían billetes perdedores. Si K puede saber que va a perder sobre la base 
de esa equivocidad despreciable (por un razonamiento similar) puede sa- 
ber que su amigo J va a perder, dado que la equivocidad asociada con que 
J pierda es exactamente la misma que para K (y J, como K, va a perder). 
De donde podemos concluir que (de acuerdo con el principio de conjun- 
ción) K sabe que tanto él como J van a perder. Pero K tiene millares de 
amigos sin suerte. Todos ellos provistos de boletos perdedores. Si la equi- 
vocidad despreciable no es un obstáculo para el conocimiento, K puede 
saber de cada uno de sus amigos que va a perder. Pero si lo sabe de cada 
uno, por el principio de conjunción, lo sabe de todos. Sin embargo, la equi- 
vocidad asociada con su conocimiento de que todos los amigos van a per- 
der ya no es despreciable. Dependiendo del número de sus amigos, puede 
llegar a ser sustancial. S1, por poner un caso extremo, tiene 500.000 amigos 
sin suerte, la equivocidad asociada a la conjunción total sobrepasa com- 
pletamente a la pequeña cantidad de información que K tiene sobre la ver- 
dad de cada uno de los elementos conjuntados. De hecho, K no recibe nin- 
guna información sobre si la conjunción es o no verdadera (está al 50%), 
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a pesar de que tenga una información positiva sobre la verdad de cada uno 
de los elementos conjuntados. Nos vemos llevados al resultado absurdo de 
que K puede saber algo sobre lo que no ha recibido ninguna información 
—por ejemplo, puede saber que ninguno de sus (500.000) amigos va a 
ganar la lotería— a pesar de que (dada la información que ha recibido) la 
probabilidad de ese resultado es sólo del 50%. 

La única manera de evitar esta consecuencia es abandonar la hipótesis 
de que K puede saber que s es F sin haber recibido la información de que 
ses F. El conocimiento de que ses F no requiere simplemente información 
sobre s sino, en concreto, la información de que s es F. Dado que este 
requisito es impuesto por nuestro análisis del conocimiento basado en la 
información, concluyo que, al menos en este extremo, el análisis es satis- 
factorio. 

Puede suponerse que esta conclusión es evitable si abandonáramos el 
principio de conjunción. Y que esto es posible. Pero me parece que tal 
principio es absolutamente fundamental. Ni siquiera estoy seguro de cómo 
argumentar en su favor. Sin embargo, debe ponerse de relieve que el prin- 
cipio de conjunción no dice que si uno sabe que P y sabe que O, sabe lo 
que se sigue lógicamente de P y O. Es posible, por ejemplo, que K sepa 
que A es mayor que B y que B es mayor que C sin saber que A es mayor 
que C. El principio de conjunción no elimina esta posibilidad. Ni siquiera 
implica que si alguien sabe que P y sabe que O, entonces cree, sabe o es- 
taría dispuesto a reconocer que sabe tanto P como O. Estos últimos «prin- 
cipios» también tienen sus defensores, pero creo que deben ser rechazados. 
Al menos debemos diferenciarlos del principio de conjunción. Y cuando 
distinguimos a éste de sus parientes más sospechosos, creo que es obvio 
que el precio que deberíamos pagar por abandonarlo es exorbitante.”” 





77 Brian Skyrms considera el principio de la conjunción y concluye que a menos que requi- 
ramos evidencia de (probabilidad) 1, el principio no es válido. Sugiere que esto apoya al 
escéptico o muestra que el conocimiento no satisface este principio. Véase «The Explication 
of “X knows that p”», The Journal of Philosophy, vol. 64, n* 12, junio 22, 1967; reimpreso 
en Knowing, Roth y Galis (eds.), págs. 109-110. Dado que requiero una probabilidad de 1 
(equivocidad 0), concluyo que el principio sí que es válido. En el capítulo siguiente intento 
mostrar por qué esto no apoya el escepticismo. 
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La comunicación 


Nuestro concepto común de conocimiento incluye el que éste es algo 
que puede ser transmitido por comunicación entre partes conocibles. Si 
Herman sabe que s es F, puede, por medio de la palabra o de la acción, 
provocar el que Shirley sepa que s es F. Puede decírselo. Por supuesto, si 
Herman no es sincero, o si sus oyentes creen que no lo es, sus emisiones 
carecerán del habitual resultado cognitivo.?* Nadie le creerá. Pero si se ha 
de dar comunicación y aprendizaje habituales, debe existir alguna relación 
entre individuos que pueda servir como la base para el aprendizaje, para 
impartir conocimiento. Podemos intentar resumirlo diciendo que cuando 
un hablante sabe que s es F, asevera sinceramente que s es F' con el propó- 
sito de informar a sus oyentes de lo que sabe que es el caso, es normal- 
mente digno de confianza en este tipo de cosas, y sus oyentes creen — 
razonablemente— que lo es, los oyentes pueden aprender (llegar a cono- 
cer) que s es F sobre la base de lo que el hablante les dice. No sé realmente 
si ésta es una base suficiente para impartir conocimiento por medios ver- 
bales. Pero, sean las que sean las condiciones reales, nuestra práctica ha- 
bitual demuestra que estamos convencidos de que estas condiciones se dan 
frecuentemente en nuestro intercambio cotidiano. Dado que suponemos 
habitualmente que es así como aprendimos algo: lo oímos de Herman, leí- 
mos su libro, lo vimos en el diario o lo escuchamos en el informativo de la 
noche. 

Consideremos, ahora, lo que sucede a la comunicación de este tipo si 
negamos que la información de que s es FF es esencial para el aprendizaje 
de que s es F. Podemos imaginar una cadena de comunicación en la que 
hay una pequeña cantidad de equivocidad entre los vínculos adyacentes de 
la cadena. La equivocidad entre los vínculos adyacentes es, sin embargo, 
lo suficientemente pequeña como para no impedir que un vínculo aprenda 
lo que sucede en el vínculo inmediatamente precedente. K; recibe una se- 
ñal de la fuente s, y, aunque no se comunica la información de que s es E, 
la cantidad de equivocidad es lo bastante pequeña como para permitir que 
K: sepa que s es F. K¡ se vuelve hacia K> para decirle lo que él (K¡) sabe 
que es el caso: o sea, que s es F. Para comunicar esta información, Ki dice 





78 O él es la clase de individuo descrito en la nota 6: el tipo al que, aunque sabe que s es F, 
no se le puede otorgar ninguna confianza acerca de si algo es o no es F. 
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«s es F». Dado que la cantidad de equivocidad entre K¡ y K> es lo bastante 
pequeña como para no impedir que K» llegue a saber lo que Ki le dice, 
podemos suponer que K> llega a conocer lo que Ki dice. Aunque la señal 
auditiva que K> recibe no hace que la probabilidad de que Ki haya dicho 
«s es FE» sea igual a la unidad, aunque (por lo tanto) esta señal no transmita 
la información de que K' dijera «s es F», la equivocidad de esta señal es 
lo bastante pequeña como para permitir que K> sepa que Ki dijo que s era 
F. Dado que podemos suponer que las condiciones de comunicación son 
las ideales en cualquier otro respecto, no hay nada que nos impida concluir 
que K» podría llegar a saber, de ese modo, no sólo que K' dijo que s era F, 
sino que s era F. Después de todo, K¡ sabe que s es F, lo que dijo fue una 
manifestación sincera de lo que sabía, K> tenía una confianza bien fundada 
en la veracidad y fiabilidad de K;, y, además, K» sabe que Ki dijo que s era 
F. Seguramente, éste es el tipo de situación en el que se imparte conoci- 
miento. 

Sin embargo, hay una dificultad. La equivocidad entre los vínculos in- 
dividuales de la cadena de comunicación se acumula de tal modo que, en 
líneas generales, la equivocidad entra A y C será mayor que la equivocidad 
entre AyB o B y C. Lo que esto quiere decir en términos de nuestro ejem- 
plo es que, aunque la cantidad de equivocidad entre K; y la fuente sea muy 
pequeña (lo bastante pequeña, estamos suponiendo, como para no impedir 
que K; llegue a saber que s es F), y aunque la cantidad de equivocidad 
entre K> y Ki sea también muy pequeña (lo bastante pequeña, estamos su- 
poniendo, como para no impedir que K> llegue a conocer lo que está suce- 
diendo en Ky), la equivocidad existente entre K2 y la fuente es mayor que 
cualquiera de esas dos pequeñas equivocidades. Es decir, K> obtiene menos 
información sobre la fuente que K¡ Y cuando K transmita esa información 
a K3 (siguiendo un canal similar al que hay entre K¡ y K»), K3 recibe una 
información aún menor sobre s (por más que todavía reciba la suficiente 
información sobre K2 como para saber lo que está sucediendo allí). Cuando 
lleguemos a los vínculos más alejados en esta cadena de comunicación, 
K;, estaremos recibiendo una cantidad de información sobre s que será 
despreciable. La información sobre s se evaporará poco a poco, devorada 
por las pequeñas equivocidades que existen entre los vínculos adyacentes 
de la cadena de comunicación. 

Por supuesto, en último término alcanzamos vínculos en la cadena de 
comunicación en los que no hay virtualmente ninguna información sobre 
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la fuente. La señal que K,,+: recibe de K,, todavía llevará bastante informa- 
ción (sobre K;,,) como para que K,, +1 llegue a saber lo que K', está diciendo 
(sobre s), pero no llevará virtualmente ninguna información sobre el 
mismo s. Dado que la información sobre s puede hacerse tan pequeña 
como deseemos (desplazándonos a vínculos suficientemente distantes en 
la cadena de comunicación), debemos suponer que hay cierto punto en la 
cadena de comunicación en el que es imposible aprender que ses F a partir 
de las señales que están llegando. Después de todo, la probabilidad de que 
s sea F, dadas las señales que llegan (del vínculo precedente en la cadena 
de comunicación), puede ser tan próxima al mero azar como nos preocu- 
pemos de hacerla. 

Esto constituye, obviamente, un dilema. Y constituye un dilema para 
cualquiera que suscriba el supuesto de partida de que el conocimiento no 
requiere la recepción de la información apropiada. El dilema no es que 
cuando pasamos un mensaje de una persona a otra podemos llegar a un 
punto en el que las partes receptoras ya no pueden llegar a saber lo que las 
partes iniciales sabían (y comunicaron), sino que es difícil decir dónde está 
exactamente ese punto. Este no es un caso de la paradoja del sorites.”? Más 
bien, el dilema es que en algún momento de la cadena de comunicación el 
pupilo (K,.+1) no puede aprender de su instructor (K,,) lo que K, sabe que es 
el caso, y no puede aprenderlo de él por más que se estén comunicando 
por medio de un canal tan bueno como el que hizo que K,, aprendiera. K,, 
posee un conocimiento incomunicable, un conocimiento que no puede 
compartir con sus pupilos incluso aunque esté vinculado a ellos por medio 
de un canal de comunicación lo suficientemente bueno como para permi- 
tirle a él aprender de su maestro. El dilema está en que no podemos decir 





79 Por ejemplo, el profesor Jay Rosenberg me ha sugerido que el conocimiento puede estar 
relacionado con la información (medida en bits) al igual que la riqueza está relacionada con 
la posesión de capital (medida en la cantidades de dinero). Así como podemos desperdiciar 
nuestra riqueza, peseta por peseta, sin ser capaces de decir si hemos dejado de ser ricos y 
cuándo sucedió, también puede ser que podamos desperdiciar nuestro conocimiento, bit por 
bit, sin ser capaces de decir dónde deja de haber conocimiento (en la cadena de comunica- 
ción). 

Por muy atractiva que parezca esta sugerencia, se viene abajo porque el concepto de cono- 
cimiento (en tanto que lo entendamos como un conocimiento de hechos, no de cosas), a di- 
ferencia del concepto de riqueza, no es un concepto comparativo. Un persona puede ser más 
rica que otra incluso si ambas son ricas, pero una persona no puede saber que está lloviendo 
(por ejemplo) más que o mejor que otra. Más sobre esto en el próximo capítulo. 
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cuál es la diferencia entre, por ejemplo, K¡ y K,. Ambos saben que s es F. 
Se están comunicando con sus oyentes por medio de idénticos canales. Sus 
pupilos respectivos saben y comprenden lo que se les dice. Podemos su- 
poner que ambos son informadores fiables. Sin embargo, K¡ consigue im- 
partir conocimiento a su pupilo (K>), mientras que esto es imposible para 
Kn. 

La fuente del dilema está, desde luego, en el supuesto de que K; podría 
aprender (llegar a saber) que s es F sin haber recibido la información de 
que ses F. La dificultad que esto presenta a la comunicación es en realidad 
la misma que percibimos en relación a la paradoja de la lotería en las pá- 
ginas precedentes. Si se admite la posibilidad de saber que s es F sin la 
información de que s es F, se debe afrontar inmediatamente el hecho de 
que le falta información (equivocidad), aunque pueda parecer aceptable 
cuando se la considera aisladamente, puede acumularse rápidamente hasta 
niveles inaceptables. Independientemente de cuán poca equivocidad (ma- 
yor que cero) se esté dispuesto a tolerar, todavía sucede que esas cantida- 
des despreciables de equivocidad pueden sumarse hasta convertirse en 
algo intolerable. Una consecuencia de ello es la de que no es posible saber 
la conjunción de las cosas que (consideradas aisladamente) se saben y que 
no es posible impartir a los demás el conocimiento que se tiene. Para evitar 
esas consecuencias, debemos aceptar el punto de vista (incorporado en 
nuestra caracterización del conocimiento) de que el conocimiento de que 
ses F requiere (como causa de la creencia) la información de que s es F. 

Aunque creo que estos argumentos a favor del análisis en base a la 
teoría de la información son persuasivos, no pienso que sean decisivos. La 
prueba última para una teoría consiste en su utilidad para organizar e ilu- 
minar el material al que se aplica. Y son de igual importancia las voces 
que hablan a su favor y las que no consiguen hablar en contra. Por lo tanto, 
voy a considerar las objeciones más serias para el análisis presente, en par- 
ticular, el resto de escepticismo. 
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5. El canal de comunicación 


Conceptos absolutos 


Saber que algo es de una determinada manera no es, a diferencia de ser 
rico o razonable, una cuestión de grado. Dos personas pueden ser ricas, y 
una ser más rica que la otra; ser las dos razonables y una serlo más que la 
otra. Cuando hablamos de personas, lugares o temas (cosas más bien que 
hechos), también tiene sentido decir que una persona conoce algo mejor 
que otra. El conoce la ciudad mejor que yo, sabe más historia de Rusia que 
cualquiera de sus colegas, pero no conoce a su esposa tan bien como sus 
amigos a las suyas. Pero el conocimiento de hechos, el conocimiento de 
que s es F no admite comparaciones. Si ambos sabemos que el balón es 
rojo, no tiene sentido decir que tú lo sabes mejor que yo. Un hombre rico 
puede hacerse más rico consiguiendo más dinero, y la creencia de una per- 
sona puede hacerse más razonable acumulando evidencia adicional, pero 
si una persona ya sabe que el balón es rojo, no hay nada que pueda adquirir 
para mejorar su conocimiento. Si ya lo sabe, la evidencia adicional no po- 
drá elevarlo a formas más excelsas de conocimiento. Es posible elevar la 
temperatura del agua que hierve más arriba del punto de ebullición, pero 
con ello no la hervimos mejor. Sólo la hervimos a una temperatura más 
alta. 

En este respecto, el conocimiento de hechos es absoluto. Los que con- 
sideran al conocimiento como una forma de creencia razonable o justifi- 
cada reconocen este hecho al hablar no simplemente de justificación, sino 
de justificación total, completa o adecuada. Estas cualificaciones sobre el 
tipo de justificación que se requiere para el conocimiento no son más que 
admitir que el conocimiento es, a diferencia de la justificación, una noción 
absoluta. Lo que se pretende expresar al calificar de ese modo es la idea 
de que hay cierto umbral de justificación que debe ser alcanzado o reba- 
sado para obtener conocimiento, que el igualar o traspasar ese umbral es 
una noción absoluta. Puedo estar mejor justificado que tú, pero mi justifi- 
cación no puede ser más adecuada (más suficiente) que la tuya. Si mi jus- 
tificación es completa en el sentido relevante, la tuya no puede ser más 
completa. 
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En general, los filósofos que consideran al conocimiento como un tipo 
de creencia justificada y verdadera tienen reticencias a la hora de hablar 
de ese supuesto umbral de justificación. Exactamente, ¿cuánta evidencia o 
justificación es suficiente para que se pueda considerar que una justifica- 
ción es total o completa? Si los niveles (o grados) de justificación se re- 
presentan por los números reales entre el O y el 1 (indicando la probabili- 
dad relativa de aquello para lo que tenemos evidencia o justificación), 
cualquier umbral inferior a 1 parece arbitrario. Peor aún, cualquier umbral 
inferior a 1 parece demasiado bajo. Ya que pueden inventarse inmediata- 
mente ejemplos en los que tal umbral particular es rebasado sin que la evi- 
dencia sea lo bastante fuerte como para conocer. Recordemos (del último 
capítulo) el ejemplo de la lotería o aquel en el que alguien extraía bolas de 
color de una urna, la mayoría de las cuales (aunque no todas) eran de color 
rosa. 

Nuestra explicación del conocimiento en base a la información funda- 
menta el carácter absoluto del conocimiento en el carácter absoluto de la 
información de la que depende. Por supuesto, la información misma no es 
un concepto absoluto, dado que podemos obtener más o menos informa- 
ción sobre una fuente. La información sobre s nos llega con distintos gra- 
dos. Pero la información de que ses Fno nos llega con grados. Es cuestión 
de todo o nada. Nadie puede alcanzar la información de que s es F mejor 
que los demás o más que los demás, porque la recepción de esa informa- 
ción requiere que la ambigiedad de la señal (en relación a que s sea FF) sea 
cero. No muy cercana a cero. Sino cero. No hay lugar para grados. Una 
vez se ha recibido la información de que s es F, no hay más información 
que poseer sobre si s es o no F. Todo lo demás es o redundante o no perti- 
nente. Tú no puedes saber que s es F mejor que yo porque no puedes al- 
canzar más información de la que yo debo haber alcanzado para conocerlo. 

Este es un análisis que no despertará mucho entusiasmo entre filósofos 
o psicólogos. Los filósofos lo considerarán una manifestación de escepti- 
cismo.* Es posible que los psicólogos crean que muestra una ignorancia 





50 La reacción de William Rozeboom es típica. Duda si el mundo contiene alguna regulari- 
dad nómica lo bastante perfecta como para otorgarle a alguna creencia el status de estar más 
allá de toda posibilidad de error. Expresado en términos de una teoría de la información, 
Rozeboom duda de si las probabilidades condicionales (que definen la equivocidad) son al- 
guna vez cero. Rozeboom extrae conclusiones escépticas de este hecho; ver su «Why I Know 
So Much More than Y our Do», en Knowing, Michael Roth y León Galis (eds.), Nueva York, 
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espantosa de la psicofísica.*! Ambas reacciones se inspiran en lo que se 
considera que son los hechos del caso. Dado que es seguro que se objetará 
que bien poco se puede conocer si el conocimiento de que s es F requiere 
no sólo cierta información sobre s (una cantidad «suficiente» O «ade- 
cuada»), sino la Información de que s es F (tal como ha sido definida). 
Puesto que en la mayoría de las situaciones prácticas las probabilidades 
condicionales son siempre menores que uno. Siempre hay alguna ambi- 
giúedad. 

Peter Unger tiene una discusión interesante sobre los conceptos abso- 
lutos, y creo que identifica lo que hay de problemático en ellos.*? Ejempli- 
fica la cuestión con el concepto de liso. Argumenta que se trata de un tér- 
mino absoluto, en el sentido de que una superficie es lisa sólo si no tiene 





1970, pág. 149. 


81 William Epstein describe el punto prevalente en psicología como sigue: «Existe un 
acuerdo general en cuanto a la relación entre estímulos distales y proximales. El punto de 
vista convencional (...) es que la relación distal -proximal es irresistiblemente equívoca. De 
hecho, la afirmación de que la estimulación proximal no puede especificar las propiedades 
de la situación distal es un supuesto mantenido por casi todos los teóricos del siglo veinte, a 
pesar de sus diferencias.» Stability and Constancy in Visual Perception, William Epstein 
(ed.), Nueva York, 1977, pág. 3. 

Egon Brunswik lo expresó diciendo que las validaciones ecológicas nunca son las mismas 
que las funcionales. La validez ecológica refiere al nivel de correlación entre los estímulos 
distales y proximales (por ejemplo, objeto distal y proyección de la retina). La validación 
funcional refiere al nivel de correlación entre la variable distal y la respuesta perceptiva. 
Véase Leo Postman y Edward D. Tolman, «Brunswik”s Probabilistic Functionalism», en 
Psychology: A Study of a Science, vol. 1, Sigmund Koch (ed.), Nueva York, 1959, págs. 502- 
562. Expresado en términos de la teoría de la información, la postura de Brunswik podría ser 
descrita diciendo que la cantidad de información contenida en una señal sensorial siempre es 
menor que la cantidad de información generada en la fuente cuando el evento ocurre. Por 
tanto, según este punto de vista, es imposible saber algo sobre el estímulo distal si el cono- 
cimiento requiere recibir información (esto es, ambigijedad cero). O el escepticismo es ver- 
dadero o esta explicación del conocimiento es errónea. Los transicionalistas arguyeron lo 
mismo al hablar de «configuraciones equivalentes», la familia de configuraciones físicas en 
la fuente para la que la señal es invariante (y, por lo tanto, equívoca). Véase Ittleson, Visual 
Space Perception, Nueva York, 1960, capítulo. 4. El trabajo de James J. Gibson es, desde 
luego, un excepción destacada respecto de la línea de pensamiento tradicional: por ejemplo, 
The Senses Considered as Perceptual Systems, Boston, 1966. 


82 Peter Unger, «A Defense of Skepticism», The Philosophical Review, vol. 80, n* 2, abril 
1971, y, más recientemente, lgnorance, Oxford, 1975. 
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irregularidades ni prominencias en absoluto. Cualquier prominencia, cual- 
quier irregularidad, por pequeña o insignificante que sea (desde un punto 
de vista práctico), significa que la superficie en la que aparece no es real- 
mente lisa. Puede ser casi lisa, o estar muy cerca de ser lisa, pero (como 
implican estas descripciones) no es realmente lisa. Es cierto que compara- 
mos superficies con respecto a cómo son de lisas (por ejemplo, esta super- 
ficie es más lisa que aquélla), pero Unger defiende de un modo convin- 
cente que esto debe entenderse como una comparación del grado en que 
esas superficies se aproximan a ser lisas. No pueden ser ambas lisas y serlo 
una más que la otra. De donde si A es más lisa que B, no es posible que B 
(y quizá tampoco A) sea realmente lisa. El ser o no liso no admite grados, 
aunque el que una superficie esté cerca de serlo sí los admita. 

Unger concluye que no hay muchas cosas que sean realmente lisas, 
dado que —ampliadas lo suficientemente— casi todas las superficies pre- 
sentan irregularidades. Por lo tanto, al contrario de lo que se piensa nor- 
malmente, tales superficies no son realmente lisas. Cuando las describimos 
como siendo lisas, lo que decimos es literalmente falso. Es posible que no 
haya nada que sea realmente liso. Que así sea. De acuerdo con Unger, ése 
es el precio que hay que pagar por operar con conceptos absolutos. 

Si el conocimiento es un concepto absoluto de este tipo, una línea si- 
milar de razonamiento nos llevará a la conclusión de que la mayor parte 
de nuestras pretensiones de conocimiento son falsas. Al menos, éste es el 
temor de muchos filósofos. Una gran ampliación (es decir, la investigación 
crítica) revelará pequeñas «abolladuras» o «irregularidades» en situacio- 
nes en las que normalmente aplicamos el concepto de conocimiento. En 
realidad, hay razones para pensar que tales irregularidades se dan por do- 
quier, infectando incluso lo que consideramos las formas más inmediatas 
y seguras de conocimiento. Así pues, admitir que el conocimiento es un 
concepto absoluto sería jugar con la idea de que, en realidad, quizá no se 
sepa nada. 

Esta conclusión escéptica es inaceptable. Unger la apoya. El conoci- 
miento, según él, es un concepto absoluto que, como la propiedad de ser 
liso, tiene escasa aplicación en nuestro mundo lleno de abolladuras e irre- 
gularidades. Ya he indicado en qué estoy de acuerdo con Unger. La noción 
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de conocimiento es una noción absoluta. Hereda esta cualidad de la infor- 
mación de la que el conocimiento depende.** Sin embargo, a diferencia de 
Unger, no extraigo conclusiones escépticas de este hecho. Admitiré sin 
reticencia de ningún tipo que la propiedad de ser liso es un concepto abso- 
luto, y absoluto en la manera en que, más o menos, Unger dice que lo es; 
pero no creo que ello muestre que no hay nada liso. Dado que, aunque nada 
pueda ser liso si tiene abolladuras o irregularidades, lo que cuenta como 
una abolladura o irregularidad depende del tipo de superficie que se esté 
describiendo. Algo está vacío (otro concepto absoluto de acuerdo con Un- 
ger) si no hay nada en su interior, pero ello no demuestra que mi bolsillo 
o un almacén abandonado no estén realmente vacíos porque hay algo en 
su interior. El polvo o las moléculas de aire no cuentan cuando se trata de 
determinar si los bolsillos o los almacenes están vacíos. Por supuesto, si 
cambiáramos la forma en que usamos el almacén (por ejemplo, como una 
cámara de vacío gigante) tales cosas sí tendrían importancia. Lo único que 
queremos decir es que las moléculas de aire no se tienen en cuenta, dada 
la manera en que ahora estamos usando el almacén. De un modo parecido, 
una carretera puede ser perfectamente lisa, incluso aunque puedan perci- 
birse algunas pequeñas irregularidades en su superficie, el tipo de irregu- 
laridades que, si fueran descubiertas en la superficie de un espejo, signifi- 
carían que la superficie del espejo no era realmente lisa. Los ratones gran- 
des no son grandes animales, y las carreteras lisas no son necesariamente 
superficies lisas.** La Sociedad de la Tierra Plana puede ser un anacro- 
nismo, pero no niega la existencia de valles y montañas. 

El conocimiento presenta una lógica similar. Aunque se trate de un 
concepto absoluto, un carácter que hereda de la información de la que de- 
pende, ello no implica que el conocimiento sea inalcanzable. Se puede 
transmitir información del tipo necesario. Las irregularidades que el es- 
céptico pretende encontrar en el canal de comunicación no son irregulari- 
dades en absoluto. Al menos, no cuentan como tales para el propósito de 





$3 Unger remite el carácter absoluto del conocimiento al concepto de certeza. Por tanto, en 
este punto estamos en desacuerdo. 


84 Como John Austin diría, «liso» es una palabra hambrienta de sustantivos: un X liso puede 
no ser un Y liso al igual que un X real puede no ser un Y real. Sense and Sensibilia, Oxford, 
1962, pág. 69. 
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la comunicación. Este es el extremo que quiero clarificar en el resto del 
presente capítulo. 


Condiciones del canal 


El punto de vista de que el requisito sobre el conocimiento impuesto 
por la información es excesivamente estricto, que no puede satisfacerse 
(en la mayoría de las situaciones prácticas), descansa, en último término, 
en la confusión entre: 1) la información que una señal transporta (sobre 
una fuente), y 2) el canal del que depende la transmisión de esa informa- 
ción. Si suponemos erróneamente que la dependencia de una señal res- 
pecto a una fuente es menor que la óptima en la medida en que está condi- 
cionada por factores sobre los que la señal no transmite ninguna informa- 
ción, consideraremos que cualquier comunicación es imposible y, de aquí, 
que es imposible el conocimiento que (de acuerdo con el presente análisis) 
depende de la transmisión de la información. 

Sin embargo, consideremos un instrumento de medición simple: un 
voltímetro unido a una resistencia en un circuito eléctrico. La función de 
este instrumento es la de medir diferencias en el voltaje, en este caso el 
voltaje inducido en la resistencia. Supongamos que tal voltaje es siete vol- 
tios. Cuando incorporamos el voltímetro, esta diferencia de voltios genera 
un flujo de corriente en el circuito interno del instrumento. El flujo de co- 
rriente produce un campo magnético que ejerce una fuerza de giro sobre 
una armadura; la armadura gira (venciendo la presión contraria de un mue- 
lle) y un indicador (unido a la armadura) se mueve sobre una escala cali- 
brada convenientemente en el exterior del instrumento. El indicador se de- 
tiene sobre el 7. 

Este instrumento (en realidad, cualquier instrumento de medición) 
puede considerarse como un sistema de procesamiento de información. 
Cuando funciona correctamente, la información generada en la resistencia 
por la diferencia de siete voltios entre sus hilos de entrada, se comunica al 
exterior del instrumento. La posición del indicador transmite información 
sobre el voltaje en la resistencia. Si, por poner un ejemplo, pensamos que 
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el voltaje sólo puede tener diez valores,% en la fuente se generarán apro- 
ximadamente 3,3 bits de información. Si, como suponemos, el instrumento 
funciona perfectamente, la ambigúedad entre la fuente (voltaje en la resis- 
tencia) y el receptor (posición del indicador) es cero: que el indicador re- 
glstre siete voltios transmite la información de que el voltaje inducido en 
la resistencia es de siete voltios. Y, de acuerdo con el presente análisis, 
esto capacita al usuario para decir (saber) cuál es el voltaje inducido en la 
resistencia. 

No obstante, debemos advertir que aunque el indicador transporte esta 
información sobre el voltaje inducido en la resistencia, aunque la equivo- 
cidad supuesta sea cero, o muy cercana a cero, cuando el instrumento fun- 
ciona correctamente, la posición del indicador depende en gran medida 
(incluso cuando el instrumento funciona bien) de muchas otras cosas ade- 
más del voltaje de la fuente. Si, por ejemplo, colocamos cables con distinta 
resistencia en los extremos que conectan el instrumento al circuito, el 
mismo voltaje inducido en R (la resistencia) generará un flujo de corriente 
diferente en el voltímetro, un campo magnético distinto, otro efecto de giro 
sobre la armadura y una posición distinta para el indicador. Hay un muelle 
incorporado a la armadura calibrado exactamente para ejercer una presión 
contraria sobre la fuerza giratoria del campo magnético y para permitir que 
la armadura deje de rotar en el punto deseado. Si modificamos tal muelle, 
si se estropea o se rompe, el indicador se detendrá en un punto equivocado. 
De modo que el estado de cosas que existe en el receptor (la posición del 
indicador) depende de otros muchos factores además de los que están re- 
lacionados con la fuente (el voltaje en R). De hecho, podríamos obtener el 





85 Para los propósitos epistémicos, existe siempre un conjunto discreto, finito, de voltajes 
en R. Nos enteramos de que el voltaje de R es siete más que seis, ocho o algún otro valor 
apreciablemente diferente de siete. Si la afirmación de que sabemos que el voltaje es siete 
implica, o se considera que implica, que el voltaje no es 7,001 o 6,999, entonces, por su- 
puesto, el instrumento debe transmitir una cantidad de información correspondientemente 
mayor para que sepamos, dado que el número de posibilidades eliminadas es mayor. En ge- 
neral, el número de dígitos usado para expresar lo que se sabe se corresponderá con el nivel 
de precisión implicado. En un sentido, ayuda a indicar lo que es conocido. Por esta razón se 
necesita más información (y, por lo tanto, un instrumento de mayor sensibilidad) para saber 
que el voltaje es 7,000 de las que se necesita para saber que es siete. 
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mismo resultado (siete voltios) manipulando esas otras variables. Podría- 
mos reducir el voltaje en R a cinco voltios y debilitar proporcionalmente 
el muelle, y el instrumento registraría todavía siete voltios. 

Dados estos hechos, y hechos semejantes podrían describirse sobre 
cualquier canal de comunicación, puede parecer que nuestra pretensión de 
que en esta situación teníamos una comunicación perfecta era exagerada. 
¿Cómo es posible que lo que el indicador registra lleve la información de 
que el voltaje es de siete voltios? Dada la definición de una señal que lleva 
la información de que s es F, el indicador lleva esa información sólo 
cuando, dada la posición del indicador (y k: cosas que se sabe que ocurren 
en base a razones independientes)ó la probabilidad condicional de que 
haya siete voltios inducidos es la unidad. Pero, como hemos visto, la 
misma posición del indicador puede producirse con una inducción de cinco 
voltios y un debilitamiento de la contrapresión del muelle. ¿Qué excluye 
esta posibilidad? Después de todo, no hay nada en la posición del indica- 
dor mismo que pueda señalar que la contrapresión del muelle no se ha 
debilitado repentinamente. Incluso si el muelle fue comprobado antes de 
que el instrumento se usara, ¿qué excluye la posibilidad de que se haya 
debilitado desde que fue comprobado? Si no hay nada en la señal (posición 
del indicador) que Indique que el muelle no se ha debilitado, ¿cómo puede 
ser igual a cero la probabilidad de que no se haya debilitado, dado lo que 
registra el indicador? Pero si esta probabilidad no es cero, la probabilidad 
de que el registro de siete voltios se produzca por una diferencia de voltaje 
de cinco en R, coincidiendo con un debilitamiento del muelle, tampoco es 
cero. De donde la probabilidad condicional (dado lo que registra el indica- 
dor) de que el voltaje inducido en R sea de siete voltios no puede ser la 
unidad. La equivocidad debe ser mayor que cero incluso cuando el instru- 
mento funciona perfectamente, a menos, por supuesto, que se sepa (sobre 
fundamentos independientes) que el instrumento funciona perfectamente. 

La conclusión de esta línea de razonamiento es que los voltímetros y 
otros instrumentos de medida nunca transmiten la información para cuya 





86 Si se sabe que una condición ocurre sobre bases independientes (por ejemplo, se ha com- 
probado la elasticidad del muelle compresor), las probabilidades condicionales que definen 
la información transmitida son computadas en relación al valor conocido de la condición en 
cuestión. Estas condiciones son meramente aquellas denotadas por k en nuestra definición 
del contenido informativo de una señal (consultar el capítulo 3). 


— 137 — 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


transmisión han sido diseñados. La señal siempre depende de condiciones 
distintas a que s sea F, condiciones cuyo valor se desconoce cuando se usa 
el instrumento para que transmita información sobre si s es F. Por lo tanto 
la señal siempre es equívoca respecto a la fuente. Si una señal se transmite 
a través de un canal en condición C, y existen estados posibles del canal 
C* en los que es posible que se transmita el mismo tipo de señal sin que s 
sea F (como siempre existen), podemos concluir que la señal no lleva la 
información de que s es F a menos que se sepa que el canal está en la 
condición C en el momento de recepción de la señal. 

Los filósofos reconocerán inmediatamente esta objeción como la 
análoga para la teoría de la información de una tesis escéptica bien manida, 
la de que si nuestra experiencia sensorial depende no sólo del carácter de 
los objetos que percibimos, sino también de las condiciones de nuestro 
aparato sensorial, de la naturaleza de la iluminación, del medio inter- 
puesto, etc., no podemos (o no debemos) confiar en la experiencia senso- 
rial misma para que nos diga las propiedades de los objetos que percibi- 
mos. El estado sensorial, considerado en sí mismo, siempre es equívoco. 
Es equívoco incluso cuando todos los sistemas funcionan de la mejor ma- 
nera que son capaces de hacerlo. 

Desde el punto de vista de la teoría de la información, la tesis escéptica 
equivale a la pretensión de que para el propósito de computar la ambigiie- 
dad entre la fuente y el receptor, para el propósito de determinar cuánta (y 
por tanto qué) información una señal transporta sobre la fuente, no hay 
ninguna condición (a menos que esté determinada sobre fundamentos in- 
dependientes) que pueda darse por sentada. Cualquier cosa es una fuente 
potencial de equivocidad. Incluso si el muelle que ejerce la contrapresión 
en nuestro voltímetro está diseñado especialmente para retener su elastici- 
dad, fabricado para que no se debilite con el uso prolongado, no podemos 
dar por supuesto tal hecho para determinar el grado de dependencia (y por 
tanto de equivocidad) que existe entre lo que marca el indicador y el vol- 
taje. Ya que, en la medida en que la señal (lo que marca el indicador) no 
excluya la posibilidad de que el muelle se halla debilitado,%” un muelle 
débil debe considerarse todavía como una posibilidad desde el punto de 





87 Mientras se calibra (usando el instrumento para medir valores conocidos de una canti- 
dad), la aguja puede llevar información acerca del estado de la fuente. Pero en su actuación 
normal no la lleva. Enseguida diré algo más sobre esto. 
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vista de esta señal. Pero si esto es una posibilidad acorde con la señal, 
también lo es el que el voltaje en R no sea siete. De modo que, a menos 
que haya algo en la señal que impida un estado anormal en las variables 
del canal, o que (sobre fundamentos independientes) sepamos que éstas 
están en estado normal, la señal no llevará la información requerida sobre 
la fuente. 

La receta escéptica para determinar la cantidad de información que una 
señal lleva sobre una fuente alimenta el punto de vista de que una señal no 
puede llevar la información de que ses F' a menos que ella misma (o alguna 
otra señal simultánea) lleve también la información de que el canal (por el 
que se recibe la señal) no se encuentra en uno de esos estados en los que 
la señal puede recibirse cuando s no es F. De acuerdo con la fórmula es- 
céptica, las señales que llevan información deben autovalidarse. Para que 
una señal pueda llevar la información de que s es F debe dar también tes- 
timonio de que lo que lleva es información, de que ella misma sí depende 
(en el sentido no ambiguo que se requiere) de las condiciones en la fuente. 

Hay poco que ganar al alinearse con el escéptico en este problema. Su 
posición combina un descubrimiento elemental con una recomendación, 
y, aunque el descubrimiento es real, no apoya la recomendación. No de- 
muestra lo que él considera que demuestra, no más de lo que el descubri- 
miento de pequeñas arrugas en una carretera demuestra que la carretera no 
es realmente lisa. El descubrimiento del escéptico es el de que una señal 
que lleva información sobre una fuente depende normalmente no sólo de 
la fuente, sino también de una multitud de circunstancias que (normal- 
mente) desconocemos. Lo que nos recomienda es que tratemos este hecho 
como un signo de que la señal no lleva realmente la información sobre la 
fuente que normalmente consideramos que lleva. El descubrimiento no 
apoya la recomendación porque algunas condiciones existentes (de las que 
la señal depende) no generan información, o no generan información 
nueva, para ser llevada por la señal. De hecho, esto es lo que constituye el 
canal de comunicación: 


El canal de comunicación = el conjunto de condiciones existentes (de las que 
depende la señal) que 1) o bien no generan información (relevante), o 2) generan 
sólo información redundante (desde el punto de vista del receptor). 


Esta es la razón por la que una señal, aunque dependa de condiciones 
tanto en el canal como en la fuente, sólo lleva información sobre la fuente. 
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Entre las condiciones de las que la señal depende, sólo la fuente genera 
nueva información. 

Consideremos de nuevo el voltímetro. Los cables por medio de los cua- 
les el instrumento está conectado (eléctricamente) a puntos diversos de un 
circuito tienen cierta resistencia. Lo que registra el aparato depende de esa 
resistencia, dado que la dirección del indicador depende de la cantidad de 
corriente que fluye en el instrumento y eso, a su vez, depende de la resis- 
tencia de los cables (entre otras cosas). Si la resistencia de los cables va- 
riara de un momento a otro, o de un día a otro, la posición del indicador 
variaría de un modo correspondiente sin que se hubiera medido cambio 
alguno en el voltaje. De modo que, si la resistencia de los cables variara, 
la posición del indicador sería equívoca respecto a la medición del voltaje. 
Pero la resistencia de esos cables no puede hacerse variar de la manera en 
que esa hipótesis contempla.*$ La resistencia de un cable es función de su 
constitución física y de sus dimensiones, y estas propiedades no son capri- 
chosas. Por supuesto, podemos cortar un cable, o éste se puede romper, 
pero, en la medida en que permanezca intacto, un valor estable para su 
resistencia no genera por sí mismo ninguna información. Que los cables 
no cambien su resistencia, que tengan la misma resistencia que tenían ayer 
(o la semana pasada), no es una condición que genere información porque 
éstas no son alternativas posibles (relevantes). Se trata de una condición 
del canal porque no genera ninguna información para ser transportada por 
la señal (que nos llega por los cables). 

La calibración periódica y el ajuste de tales instrumentos es, por su- 
puesto, necesaria, ya que los muelles pierden elasticidad en períodos pro- 
longados de tiempo, los cables se rompen, las conexiones pueden aflojarse, 
etc. Pero con ello lo único que decimos es que, antes de usar un instru- 
mento para medir el voltaje, es preciso obtener información sobre la inte- 
gridad mecánica y eléctrica del sistema cuya responsabilidad es propor- 
cionar información sobre las diferencias de voltaje. Una vez que el instru- 





88 Hablando con propiedad, esto no es verdad. Dado que la resistencia depende de la tem- 
peratura, y la temperatura puede variar mientras se está usando el instrumento, la resistencia 
variará ligeramente. Sin embargo, para los propósitos habituales, se pueden ignorar estas va- 
riaciones mínimas, dado que no producen equivocidad alguna. Los cambios inducidos ocu- 
rren muy por debajo del nivel de precisión al que opera el instrumento. 
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mento se ha calibrado y ajustado, hay ciertas operaciones que son redun- 
dantes por completo. La comprobación repetida de los cables (para ver si 
ha variado su resistencia), las pruebas diarias sobre elasticidad del muelle 
(para ver si ha cambiado de un modo imprevisto su coeficiente de elastici- 
dad), el recuento de las vueltas en los electroimanes internos (para asegu- 
rarse de que el mismo flujo de corriente generará el mismo campo magné- 
tico) son innecesarios. Cuando se llevan a estos extremos, se convierten en 
actividades neuróticas. Es como una persona que vuelve una y otra vez a 
la puerta para asegurarse de que está cerrada. Esa persona no está obte- 
niendo nueva información (o sea, la de que la puerta todavía está cerrada) 
dado que el que la puerta todavía esté cerrada no genera ninguna informa- 
ción nueva, ninguna información que no tuviera ya (veinte segundos antes) 
cuando obtuvo la información de que entonces estaba cerrada. Dado que 
estaba cerrada veinte segundos antes, cada nuevo acercamiento a la puerta 
es informativamente redundante. La redundancia puede ser psicológica- 
mente reconfortante, y en esa medida puede ser epistemológicamente per- 
tinente (es decir, en la medida en que afecte la propia disposición a la 
creencia), pero no tiene ninguna significación epistemológica. 

Existe un número enorme de condiciones cuya estabilidad y ausencia 
de estados posibles y alternativos (relevantes) las califica como condicio- 
nes del canal. La cantidad de corriente que fluirá a lo largo de un cable de 
una determinada resistencia tras la aplicación de determinado voltaje, la 
cantidad de flujo magnético que creará una corriente determinada fluyendo 
por el cable enrollado, la cantidad de fuerza giratoria que se ejercerá sobre 
una armadura determinada por ese campo magnético y la cantidad de mo- 
vimiento de rotación que sufrirá esa armadura como resultado de la acción 
de su fuerza de giro contra la presión contraria de un muelle particular, son 
condiciones que no tienen alternativas posibles relevantes. Incluso aunque 
la señal dependa de que esas relaciones sean de ese modo —en el sentido 
de que sí fueran diferentes, o sí cambiaran al azar, la señal sería ambigua— 
, tales condiciones no contribuyen en modo alguno a ninguna ambigiiedad 
real, ya que no generan ninguna información que pueda transmitir la señal. 
Dado que no originan información ninguna, esas condiciones cuentan 
como el marco de referencia dentro del cual se da la comunicación, no 
como una fuente sobre la que se da la comunicación. 

Sin embargo, como ya he indicado, algunas condiciones tienen estados 
que son genuinas alternativas posibles. Ellas sí generan información. Los 
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cables se pueden romper, las conexiones se pueden aflojar, algunos puntos 
pueden corroerse, los muelles pueden perder su elasticidad y las partes 
móviles pueden atascarse o doblarse. Cuando esas posibilidades son ge- 
nuinas (tendré más que decir en un momento sobre lo que constituye una 
posibilidad alternativa «genuina» o «pertinente») y las señales recibidas 
sobre un canal no excluyen por sí mismas esas posibilidades, deben ser 
excluidas sobre fundamentos independientes. En el caso de los instrumen- 
tos de medida, esto quiere decir que se necesitará de la comprobación y el 
calibrado periódicos. Examinamos los cables antes de usar el instrumento, 
ajustamos el punto cero y comprobamos la corriente continua. Si el instru- 
mento no ha funcionado durante mucho tiempo, pueden ser necesarias pre- 
cauciones mayores. Es posible que deba ser calibrado de nuevo. Es decir, 
usamos el instrumento para medir valores conocidos y comprobar si el ins- 
trumento los registra correctamente, si lo que indica es lo que, sobre fun- 
damentos independientes, sabemos que es el valor correcto. Si se sabe que 
O tiene el valor de 6, y el instrumento registra 6, con ello se nos da infor- 
mación sobre la fiabilidad del instrumento —información sobre que el 
muelle no se ha deformado, que los cables no se han roto, que el indicador 
no se ha atascado, etc. En el uso ordinario, el instrumento actúa como un 
canal para transmitir información sobre O. Durante el proceso de cali- 
brado, los valores conocidos de O se usan para obtener información sobre 
el instrumento. Es importante advertir, sin embargo, que sólo podemos ob- 
tener información sobre el instrumento si (temporalmente) lo dejamos de 
usar como un canal transmisor de información sobre O. No podemos uti- 
lizar el instrumento simultáneamente para obtener información sobre O y 
sobre su propia fiabilidad. A/go debe funcionar como canal para que algo 
pueda contar como la fuente. El mismo fenómeno se da cuando ponemos 
a prueba a un amigo sobre el que tenemos sospechas. Le pedimos que nos 
cuente algo de lo que estamos informados. Su respuesta nos cuenta cosas 
(nos da información) sobre él, no sobre la situación que él describe (quizá 
con toda precisión). Suponer que podríamos recibir información sobre la 
fiabilidad del canal al mismo tiempo que el canal está funcionando como 
un canal es como suponer que un hablante podría dar a sus oyentes infor- 
mación sobre su propia fiabilidad si añadiera «y todo lo que he dicho es 
verdad» al final de todas sus afirmaciones. Esto no da información alguna 
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sobre la fiabilidad del hablante; como mucho, da a sus oyentes una infor- 
mación redundante (esto es, ninguna información nueva) sobre lo que el 
hablante ha descrito. 

Una vez realizadas estas pruebas y comprobaciones, ya se han fijado 
las condiciones sobre las que se ha recibido información, y por lo tanto ya 
cuentan como parte del canal para el período en el que no exista una ge- 
nuina posibilidad de que se hayan transformado en un estado alternativo. 
Es decir, funcionan como parte del canal para el período de tiempo en el 
que su estabilidad en la condición fijada no genera nueva información, 
información que no fue obtenida en la prueba inicial. Unas pocas opera- 
ciones simples, operaciones que realizan rutinariamente los técnicos, bas- 
tan para fijar el estado de las condiciones del canal: todo está conectado 
apropiadamente, los cables no están rotos, el indicador no está atascado, 
etcétera. Si las comprobaciones iniciales determinan que el muelle no se 
ha roto, ni ha perdido elasticidad, ni se ha aflojado... la integridad del mue- 
lle puede ser considerada una condición del canal por lo menos durante 
algunas horas, probablemente días y quizás incluso meses (lo que depen- 
derá de la calidad del instrumento). Este se convierte en un canal de infor- 
mación porque durante horas, probablemente días y quizás incluso meses, 
el estado del muelle no generará ninguna información nueva, ninguna in- 
formación que no se hubiese obtenido ya en las comprobaciones prelimi- 
nares. Los muelles no cambian su coeficiente de elasticidad de un mo- 
mento a otro más de lo que las puertas se abren espontáneamente. Insistir 
en volver a comprobar esta condición cada veinte minutos es comportarse 
de un modo tan neurótico como quien empujara la puerta cada veinte mi- 
nutos para asegurarse de que está cerrada todavía. Es cierto que los muelles 
se desgastan, pero (cuando se usan normalmente) no lo hacen de un día a 
otro. A veces se rompen, pero la información al respecto es transmitida por 
la señal misma (el indicador que se desplaza con violencia hasta el límite 
de la escala). 

Las cosas (árboles, gente, flores) cambian de tamaño, pero lo hacen 
con diferente rapidez. Tu nieta crece, pero no entre el desayuno y la co- 
mida. Si la viste ayer (o la semana pasada), la altura que tenga hoy puede 
funcionar como una condición de canal para transmitir información sobre 
(por ejemplo) la distancia a la que está, incluso en ausencia de otras claves 
(gradientes de textura, etc.). El verla ayer (en un contexto familiar en el 
que era accesible la información sobre su tamaño) fue, en efecto, un nuevo 
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calibrado. Es cierto que en condiciones de visión reducidas (visión con un 
solo ojo inmóvil y sin más clases) las señales que llegan son, en cierto 
sentido, inequívocas. El ángulo en que llegan los rayos de luz y, por ello, 
el tamaño de la imagen de la retina, depende de dos cosas: el tamaño real 
del objeto contemplado y la distancia de ese objeto al observador. Sin em- 
bargo, eso no quiere decir que la señal sea equívoca. Que lo sea o no de- 
penderá de si el tamaño del objeto genera alguna (nueva) información, de 
si el tamaño del objeto ha sido fijado y, por lo tanto, de si está funcionando 
como una condición de canal por medio de la cual se transmite la informa- 
ción sobre la distancia. Si alguien ha vuelto a calibrar en relación a la va- 
riable distancia en el pasado reciente (cuán reciente ha de ser para ser su- 
ficiente dependerá, entre otras cosas, del objeto de que se trate: una per- 
sona, un roble o un narciso), las señales que lleguen llevarán información 
inequívoca sobre la distancia del objeto.*?? 

La situación es exactamente paralela a algunos aparatos comprobado- 
res que funcionan con una batería que pierde poco a poco su potencia en 
condiciones de trabajo normales. Antes de usar tales aparatos es necesario 
ajustarlos con la batería (para compensar las pérdidas de potencia), a fin 
de que puedan darnos la información para la que han sido diseñados. Tales 
condiciones semipermanentes que cambian poco a poco deben fijarse para 
que puedan servir como parte del canal. Durante períodos breves (después 
del ajuste) la condición real de la batería no genera ninguna información 





$9 Si una persona familiar (esposa, marido, etc.) entra en una habitación de Ames (habita- 
ción distorsionada construida de tal forma que parece normal desde el restringido lugar es- 
tratégico del sujeto que la ve) ilustra la forma en que nuestros sistemas conceptuales operan, 
casi automáticamente, de acuerdo con estos principios. La persona familiar no parece exce- 
sivamente grande o pequeña (como lo hacen objetos o personas de tamaño no conocido), sino 
que la habitación parece distorsionada. Desde el punto de vista de la teoría de la información, 
esto puede ser descrito diciendo que el sistema perceptivo toma el tamaño de la persona co- 
nocida como un punto de referencia fijo (condición del canal) para establecer la configuración 
del material circundante. Para esta serie de interesantes experimentos, véase Human Behavior 
from the Transactional Point of View, Franklin P. Kilpatrick (ed.), Department of the Navy, 
Washington, D.C., 1952. 

Como otros ejemplos de condiciones de canal para nuestros sistemas sensoriales, se podría 
mencionar la distancia entre los ojos (para información estereoscópica sobre profundidades), 
la distancia entre las orejas (para información precisa sobre la dirección), y el hecho de que 
la luz normal exterior llegue desde arriba (para obtener información desde las sombras sobre 
depresiones y protuberancias). 
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ya que, como la puerta cerrada, el que conserve su estado original no tiene 
alternativas relevantes. 

Es importante poner de relieve que lo que hace que una condición 
cuente como una condición de canal no es que sepamos que es estable, ni 
que sepamos que carece de alternativas pertinentes, sino que sea estable, 
que carezca de estados alternativos pertinentes, que de hecho no genere 
ninguna (nueva) información. Podemos imaginar a un técnico que se ne- 
gara a confiar en su instrumento. Cada pocos minutos repetiría comproba- 
ciones detalladas: mediría la resistencia de los cables, verificaría el número 
de vueltas, calibraría el muelle, etc. Lo que hay que destacar de tales pre- 
cauciones es que son innecesarias para los propósitos de transmitir infor- 
mación.” Un instrumento que no sufra esas comprobaciones (cada pocos 
minutos) transmite tanta información como uno que las sufre. Si tales pre- 
cauciones son necesarias para que el técnico confíe en su instrumento, que 
haga lo que quiera. Pero si, como hemos supuesto, las comprobaciones son 
realmente redundantes, si la información que él ya posee (lo sepa o no) 
excluye cualquier posibilidad genuina para esas condiciones, las compro- 
baciones son superfluas. No es posible extraer más información de un ins- 
trumento observando condiciones cuyo estado real no genera nueva infor- 
mación más de lo que es posible hacer que un puente sea seguro para pasar 
por él comprobando la fuerza de sus soportes. Dada la desconfianza del 
técnico, la información que da el instrumento sospechoso puede no tener 
su efecto habitual, puede que no cause que el técnico crea lo que el instru- 
mento marca, pero, en todo caso, la información estaría allí. 

Por supuesto, existen condiciones (de las que depende la señal) que son 
excesivamente variables como para poder considerarlas condiciones de ca- 
nal. Son una fuente constante de información. En tales casos, es esencial, 
para que se dé información (sobre la fuente), que también se transmita in- 
formación sobre esas condiciones variables. Muchas veces lo organizamos 
de forma tal que controlamos esos parámetros a través de canales separa- 
dos. Si la señal depende, por ejemplo, de la carga de la batería, y no pode- 
mos confiar en que la batería conserve la misma carga de un momento a 
otro, podemos introducir un medidor auxiliar que registre la potencia de la 





2 Y mucho menos la autoderrota, dado que tales precauciones sólo son posibles si se or- 
ganizan otros canales de comunicación (cuya fiabilidad está asegurada) como instrumentos 
usados para examinar nuestros instrumentos. 
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batería. La información sobre la fuente se nos da, ahora, por medio de una 
señal compuesta: la posición del indicador (más importante) y la indica- 
ción del medidor auxiliar. La naturaleza ha considerado oportuno instalar 
tales aparatos de control en nuestros canales sensoriales. Consideremos, 
por ejemplo, la manera en que detectamos el movimiento. Cuando mira- 
mos a un objeto móvil, el estímulo proximal (la disposición de la luz en la 
retina) se desplaza por una densa multitud de bastones y conos. A través 
del nervio óptico, se envía al cerebro una señal que transporta información 
sobre lo que sucede en la retina. Pero los ojos, la cabeza y el cuerpo tam- 
bién se pueden mover. Su posición no es una condición estable. Si los ojos 
se mueven, el estímulo proximal se desplaza por la retina incluso si lo que 
vemos es un objeto inmóvil. Sin embargo, es interesante que, en condicio- 
nes normales, no vemos moverse al objeto cuando el cambio en la estimu- 
lación de la retina es producido por nuestro propio movimiento. Los obje- 
tos parecen estar quietos pesar de la ocurrencia de un evento (un cambio 
en la disposición de la imagen en la retina) que es el mismo que se produce 
cuando vemos al objeto moviéndose. ¿Cómo es posible? Se ha dicho que 
lo que hace tal cosa posible es un recurso que sirve para el mismo propósito 
que el medidor auxiliar del instrumento que funcionaba por medio de una 
batería.?! El cerebro no sólo recibe información sobre el desplazamiento 
de la imagen en la retina, también recibe información sobre el estado de la 
retina. Si el ojo (cabeza, cuerpo) se mueve, el sistema nervioso tiene en 
cuenta ese movimiento al evaluar las señales que llegan de la retina. Si 
todo el movimiento de la imagen de la retina es explicado por el movi- 
miento del ojo o de la cabeza, la señal que en último término se produce 
cancela la información ostensible de la retina y no experimentamos nin- 
guna sensación de movimiento. Si el recurso de detección no señala ningún 
movimiento de la cabeza o de los ojos, el movimiento de la imagen de la 
retina señalará (porque entonces no está cancelado) el movimiento del ob- 
jeto. En términos de la teoría de la información, ésta es una analogía exacta 
de un instrumento que funciona por medio de una batería y que tiene un 
canal separado para detectar la potencia de ésta. Si suponemos que la in- 
formación sobre esa potencia se utiliza para ajustar la posición del indica- 
dor principal de modo que compense cualquier pérdida de potencia de la 





21 Véase Irvin Rock, An Introduction to Perception, MacMillan, Nueva York, 1975, capí- 
tulo 5; también R. L. Gregory, Eye and Brain, McGraw-Hill, Nueva York, 1966, capítulo 7. 
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batería (en vez de tener un indicador separado), tenemos, en la posición 
del indicador principal, un modelo general de la manera en la que nuestra 
experiencia sensorial transporta información sobre el movimiento de un 
objeto. 

Por supuesto, existe un límite respecto al nivel al que un sistema de 
comunicación pueda ser controlado. Pueden introducirse canales auxilia- 
res para seguir el rastro de algunos aspectos variables del sistema (por 
ejemplo, el movimiento del ojo), pero a menos que todo el proceso se re- 
pita ad infinitum para cada uno de los canales auxiliares, siempre sucederá 
que algún canal quede sin revisar. De modo que, si la información no pu- 
diera ser transmitida a través de un sistema sin transmitir información si- 
multánea (por medio de canales auxiliares) sobre la propia fiabilidad del 
sistema, sería imposible transmitir información en absoluto. Afortunada- 
mente, sin embargo, hay también un límite a las condiciones que necesita- 
mos controlar para transmitir información. Sólo es preciso controlar aque- 
llos aspectos de un sistema de comunicación cuyo estado real genere in- 
formación. Los otros son partes del canal. 

Como el regreso al infinito mencionado anteriormente muestra, hay un 
límite para nuestra capacidad de controlar los canales en los que recibimos 
información. Pero tal límite no es un obstáculo para que recibamos infor- 
mación a través de esos canales. Más bien, representa un obstáculo para 
recibir la información de orden superior de que las señales que se reciben 
transportan realmente información sobre la fuente. En el caso de la per- 
cepción del movimiento, por ejemplo, el cerebro registra lo que sucede en 
el canal de entrada en el que se recibe información sobre el movimiento de 
los objetos. Pero el cerebro no detecta la fidelidad del canal auxiliar. Pa- 
rece probable que el cerebro detecte lo que sucede en el canal principal (en 
relación al movimiento de los ojos, la cabeza y el cuerpo) al registrar las 
órdenes mandadas por el sistema nervioso central a los centros motores. 
En la medida en que todo funciona correctamente, una orden de movi- 
miento de los nervios motores sirve como información de que los ojos se 





2 «Estos ejemplos sugieren la sorprendente conclusión de que la intención u “orden” de 
mover los ojos es registrada centralmente en el cerebro y tratada como información de que 
los ojos se han movido... Por lo tanto, la evidencia apoya la conclusión de que la información 
crucial no es aferente (propioceptiva) sino una copia o registro de señales eferentes o señales 
que salen hacia los músculos.» Irvin Rock, óp. cit., pág. 187. 


== 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


están moviendo. De ese modo, el cerebro puede integrar la información 
sobre lo que los ojos están haciendo con la información recibida de la re- 
tina (relativa al movimiento de la imagen de la retina) para componer un 
mensaje que dé información sobre el movimiento del objeto. Sin embargo, 
los músculos de los ojos pueden quedar paralizados e incapaces de mo- 
verse cuando se les ordena hacerlo. En este caso hay una avería en el sis- 
tema auxiliar. El cerebro obtiene una información errónea sobre el movi- 
miento de los ojos (les «ordena» que se muevan, pero ellos no se mueven). 
Como consecuencia, los objetos parecen moverse incluso cuando todo (ob- 
jeto y ojos) está quieto. La señal induce a confusión porque el sistema sen- 
sorial no tiene ningún procedimiento para detectar la fiabilidad de sus ca- 
nales auxiliares: no hay modo de comprobar que los ojos actúan como se 
les ha ordenado. 

Sería un error concluir, a causa de que el cerebro no tenga ningún sis- 
tema de retroalimentación para detectar la fiabilidad de su sistema auxiliar 
(nada que le diga que sus órdenes a los músculos oculares están siendo 
obedecidas) que, por ello mismo, todo el canal sensorial a través del que 
recibimos información respecto al movimiento de los objetivos es ambi- 
guo o poco fiable. El que las seña les sensoriales resulten ambiguas o no 
dependerá de si la coordinación entre las órdenes centrales y la actividad 
motora, una coordinación esencial para que las señales sensoriales no sean 
ambiguas, es ella misma una condición de canal. Depende de si existen 
posibilidades alternativas genuinas para este aspecto del sistema auxiliar. 
Incluso aunque supongamos que una avería en este sistema auxiliar es una 
posibilidad real, incluso aunque supongamos que en condiciones de fun- 
cionamiento normales la fiabilidad de la actividad continua de este sistema 
genera información positiva, no hay ninguna razón para pensar que el sis- 
tema perceptivo como un todo no está siendo calibrado continuamente res- 
pecto a la integridad de esta condición. La parálisis de los músculos del 
ojo puede hacer que parezca que X se está moviendo cuando de hecho no 
se mueve, pero también hace que parezca que todo se mueve (incluso las 
cosas que, con toda certeza, sabemos que no se están moviendo). Una dis- 
función en este sistema auxiliar es tan evidente en el carácter anormal de 
las señales que se reciben como la rotura del muelle que hacía contrapre- 
sión lo era en el movimiento errático de la aguja de un voltímetro. 
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Posibilidades pertinentes y escepticismo 


La discusión revela el origen de lo que parece el hecho paradójico de 
que una persona pueda saber que (por ejemplo) s se está moviendo, y sa- 
berlo por medios sensoriales (puede ver que se está moviendo), sin saber 
que su sistema sensorial, el mecanismo por medio del que dice que s se 
está moviendo, está funcionando satisfactoriamente. La explicación de 
esta «paradoja» radica en el hecho de que la información de que s se está 
moviendo puede comunicarse a través de un canal sin que el receptor sepa 
(o crea) que el canal está en el estado apropiado para transmitir esa infor- 
mación. El receptor puede no conocer los mecanismos particulares respon- 
sables de que se proporcione información ni tener ninguna creencia, en 
ningún sentido, sobre las condiciones de las que depende la señal. No es 
preciso saber que los propios ojos no están paralizados para ver que algo 
se está moviendo. El canal es ese conjunto de condiciones existentes que 
no tienen estados alternativos pertinentes, que de hecho no generan nin- 
guna (nueva) información. En este punto no es importante que el receptor 
ignore esas condiciones particulares. En la medida en que las condiciones 
que ignora (sobre las que no tiene creencia alguna) son condiciones que, 
de hecho, no tienen estados alternativos pertinentes —o, si los tienen, tales 
estados han sido excluidos (tanto si esto es conocido o no) por información 
ya recibida, por comprobaciones y calibrados previos— en esa medida, las 
condiciones funcionan como el marco de referencia fijo (canal) dentro del 
cual la equivocidad (y, por tanto, la información) puede calcularse. No son 
una fuente de equivocidad (información). La información (y, por tanto, el 
conocimiento) sobre una fuente depende de un sistema fiable de comuni- 
cación entre la fuente y el receptor, no de si se sabe que es fiable. 

Se trata de algo lo suficientemente importante como para que lo ilus- 
tremos con algún detalle. Con tal fin, ofrezco el siguiente ejemplo.” Un 





93 Este ejemplo se asemeja a los que Gilbert Harman presenta para ilustrar un argumento 
diferente (de hecho, opuesto): esto es, que el conocimiento depende de la proximidad (o dis- 
ponibilidad general) de información (evidencia) que no poseemos; Thought, Princenton Uni- 
versity Press, 1973, capítulo 9. Yo he usado un ejemplo diferente porque tengo dudas exac- 
tamente acerca de lo que los ejemplos concretos de Harman muestran. Por ejemplo, no me 
parece que si alguien acompañó y despidió a Donald en el aeropuerto (en dirección a Italia), 
esa persona sabe ahora que él está en Italia (un mes después) sin información adicional. Sin 
embargo, las intuiciones parecen variar mucho en estos casos (véase William G. Lycan, «Evi- 
dence One Does Not Possess», Australasian Journal of Philosophy, vol. 55.2, agosto 1977, 
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instrumento muy sensible y completamente fiable (un calibrador de pre- 
sión) se usa para detectar la presión en cierta caldera. Dado que la presión 
en la caldera es una magnitud crítica, porque una presión excesiva puede 
provocar una explosión, el calibrador se hace con los mejores materiales, 
ajustado a los patrones más exactos, por medio de los métodos más cuida- 
dosos. Estos instrumentos han sido siempre completamente fiables. El ca- 
librador está colocado en una consola. Un empleado lo comprueba perió- 
dicamente. Nadie tiene la más ligera duda de que el empleado sabe cuál es 
la presión de la caldera cuando consulta el calibrador. El calibrador pro- 
porciona la información oportuna. 

Sin embargo, a pesar de una historia pasada de funcionamiento impe- 
cable, un ingeniero nervioso comienza a preocuparse por la posibilidad de 
un fallo en el mecanismo sensor de la presión y la precisión resultante del 
calibrador. Decide instalar un sistema auxiliar cuya función es detectar las 
disfunciones en el canal principal de comunicación (el sistema sensor de 
presión). Si algo va mal en el calibrador, una lucecita se encenderá en la 
consola del empleado y le avisará de que existe un problema. 

Se instala el sistema auxiliar, pero, antes de que puedan darse al em- 
pleado las instrucciones relativas a las precauciones adicionales que se han 
tomado, se produce un fallo en el sistema auxiliar. La luz de advertencia 
se enciende en la consola del empleado, pero el calibrador de presión, que 
funciona tan perfectamente como siempre, indica una presión completa- 
mente normal en la caldera. Podemos suponer que el empleado, o bien no 
ve la luz, o bien la ve, pero (ignorando su función) no hace caso de ella, y 
se forma la creencia (al ver lo que indica el calibrador) que la presión de 
la caldera es normal. Pregunta: ¿sabe el empleado que la presión de la cal- 
dera es normal? 

Desde el punto de vista de una teoría de la información sólo hay una 
manera de juzgar al respecto. Si el empleado sabía cuál era la presión de 
la caldera antes de la instalación del sistema auxiliar, antes de que a al- 
guien se le ocurriera preocuparse de sus posibles fallos, y lo sabía sobre la 
base del calibrador de la presión, entonces (dado que el calibrador en el 
que ahora confía todavía es perfectamente fiable) todavía sabe que la pre- 
sión es normal. No le podemos privar de ese conocimiento porque se haya 





págs. 114-126). Volveré a este punto en breve. 
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introducido un sistema defectuoso (y que, por lo tanto, puede causar con- 
fusión) que no ha visto o del que no sabe nada. Si el sensor estuviera dando 
información sobre la presión de la caldera antes de la instalación del sis- 
tema auxiliar, todavía está proporcionando esa información dado que su 
fiabilidad (y, por tanto, la ausencia de equivocidad en las señales que en él 
se transmiten) no se ve disminuida por la presencia de un sistema auxiliar 
defectuoso. Y, puesto que es la información que se da a la aguja del cali- 
brador de presión la que causa que el empleado crea que la presión es la 
normal, el empleado sabe que la presión de la caldera es la normal. 

Sin embargo, hay otra manera de interpretar las situaciones de este tipo. 
La segunda evaluación está influida por las mismas consideraciones que 
motivaron al nervioso ingeniero, las mismas consideraciones que provo- 
caron la inversión de tiempo y de dinero en la instalación de un sistema 
auxiliar. A pesar de la historia de eficacia sin tacha del calibrador de pre- 
sión, a pesar de la reconocida enorme improbabilidad de un fallo, la pre- 
sión de la caldera es una magnitud tan críticamente importante que incluso 
las más remotas posibilidades deben ser prevenidas. Incluso las más re- 
motas posibilidades son posibilidades relevantes. El calibrador de presión 
no es, después de todo, un instrumento infalible. Incluso aunque (de hecho) 
nunca haya fallado (y nunca fallará), podemos imaginar circunstancias en 
las que dejará de ser infalible. Debemos tomar todas las precauciones para 
eliminar esas posibilidades en la fabricación y en la instalación en los sen- 
sores de presión, pero el riesgo es tan elevado que aconseja precauciones 
adicionales. 

El lector habrá reconocido sin ninguna duda a nuestro nervioso inge- 
niero como el lobo escéptico bajo el disfraz de cordero. Si puede privar al 
empleado del conocimiento de que la presión de la caldera es normal sin 
alterar ni las creencias del empleado ni la fiabilidad de los mecanismos 
que producen esas creencias, ha cogido al pastor durmiendo la siesta. Todo 
el rebaño está en peligro. Ya que no hay nada ahora que le pueda impedir 
atacar indiscriminadamente e impugnar la fiabilidad de cualquiera de los 
sistemas auxiliares incorporados para alejar las sospechas sobre el canal 
principal de comunicación. No hay ninguna razón, después de todo, para 
pensar que los sistemas auxiliares son más fiables, que son más capaces de 
proporcionar información genuina, de lo que era el mecanismo detector de 
la presión que fue fabricado con toda meticulosidad. Necesitamos luces de 
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advertencia y calibradores auxiliares para cada uno de los sistemas auxi- 
liares. Muy pronto tendremos una consola de control densamente poblada 
por un conjunto de calibradores inútiles, inútiles porque su efecto neto 
(desde un punto de vista epistemológico) es cero. El empleado todavía no 
puede decir, después de consultar todos los calibradores, cuál es la presión 
de la caldera. La información no puede abrirse paso porque siempre hay 
ciertas posibilidades residuales (el fallo simultáneo de todos los sistemas) 
que la señal compuesta no elimina. 

En la práctica, por supuesto, nuestro ingeniero sería destinado al de- 
partamento de distribución (o de filosofía) antes de que los dueños invir- 
tieran una fortuna para calmar su viva imaginación. Pero él insistiría en 
que lo que está señalando no es un mero aspecto práctico, sino un extremo 
teórico sobre quién sabe y cuándo. 

Lo que convierte al ingeniero nervioso en una persona simpática, al 
menos para muchos, es el hecho de que comienza su campaña de un modo 
perfectamente razonable. Este es un mundo imperfecto. Á veces, creemos 
que es fiable un canal que, de hecho, no lo es. Los relojes se atrasan, los 
testigos mienten, los calibradores se rompen, las cartas son falsas, los li- 
bros (que pretenden ser historia verdadera) son fraude y las experiencias 
son ilusión. Además, hay ciertas informaciones que son tan importantes 
para nosotros que tomamos precauciones extraordinarias respecto al canal 
por el que nos llegan. Cuando Abner me dice que son las tres en punto, 
comienzo a correr (como el empleado ingenuo) sabiendo que llego tarde. 
Pero cuando Abner niega haberse puesto a beber tras golpear cuatro coches 
aparcados, el fiscal (como el ingeniero nervioso) insiste en la prueba del 
detector de mentiras. Una vez trabajé en una poderosa planta generadora 
de energía en la que había tres calibradores (más un complicado sistema 
de espejos) para permitir al empleado (tres pisos más abajo) comprobar 
una magnitud crítica (el nivel del agua en una enorme caldera). Sin em- 
bargo, los ingenieros instalan un calibrador de menor calidad en cada au- 
tomóvil para que podamos ver desde el asiento del conductor cuánta ga- 
solina hay en el depósito. Si un calibrador es suficiente para transmitir in- 
formación sobre el nivel de la gasolina en el depósito, suficiente para que 
pueda ver (y por tanto saber) que voy escaso de gasolina, ¿por qué no basta 
para los ingenieros de la planta de energía? Podría parecer que, o bien no- 
sotros, las personas corrientes, no sabemos nunca cuánta gasolina tenemos 
(porque un solo calibrador no basta para darnos la información), o bien la 
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planta de energía ha realizado un gran gasto al instalar calibradores redun- 
dantes, pues uno habría bastado para ver si el nivel del agua era el normal. 

Sin embargo, es un error concluir que porque tu reloj atrasa, no puedo 
tener confianza en el mío, que porque algunos calibradores son inexactos, 
ningún calibrador es digno de confianza, que si algunas personas mienten, 
nadie merece ser creído, que si algún periódico (libro, documento) ha es- 
tado alguna vez en un error, ningún periódico (libro, documento) aporta 
información del tipo que se requiere para que haya conocimiento. Es ade- 
más un error suponer que, si hay buenas razones prácticas para instalar 
canales de comunicación múltiples entre la fuente y el receptor, ninguno 
de esos canales puede llevar la información pertinente. La redundancia 
tiene su utilidad. Proporciona seguridad psicológica y, en la medida en que 
esa seguridad es necesaria para confiar en las señales que se reciben, es 
epistemológicamente pertinente (ya que es importante para que una señal 
sea la causa de la creencia). El escéptico tiene ciertamente razón cuando 
señala que es posible que haya ambigiúedad en un canal, equivocidad de la 
que no somos conscientes. Puede haber genuinas posibilidades alternativas 
que nosotros, por ignorancia o descuido, no hayamos apreciado. Si existe 
tal posibilidad (que en realidad se materialice o no, no es pertinente), no lo 
sabemos. No lo sabemos porque no nos ha llegado la información perti- 
nente. Pero está la otra cara de la moneda. Considerar que algo es una 
posible fuente de equivocidad no lo convierte en tal cosa. Si más tarde 
descubrimos que una condición que consideramos en un principio errática, 
inestable, poco fiables es (o era) perfectamente digna de confianza, pode- 
mos revisar al alza nuestra primera estimación de lo que la gente sabía. 
Puedo indignarme si alguien pretende saber que estoy nervioso fijándose, 
sólo, en cierto movimiento muscular en mi mejilla. Pero si más tarde des- 
cubro que el movimiento es completamente involuntario, que no puedo 
hacer que ocurra deliberadamente (al menos, no del mismo modo), y que 
sólo sucede cuando estoy nervioso, puedo (o debo) conceder que la per- 
sona sabía de lo que hablaba. Mis movimientos musculares, aunque yo no 
lo supiera, informaban sobre mi estado mental. Y es posible que algún día 
debamos revisar nuestra evaluación respecto a lo que algunos médium sa- 
ben ahora. La revisaremos cuando (pero sólo cuando) descubramos que 
tenían acceso a, y de hecho se apoyaban en, cierta información que hoy 
día tenemos razones para creer que les es inaccesible. 
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Lo que esto quiere decir es que el flujo de información, y el status de 
las creencias producidas por esa información (su status como conoci- 
miento) son relativamente inmunes a los efectos corrosivos de las dudas 
escépticas. Si (como supusimos en un principio) el calibrador de presión 
en el que confía el empleado es digno de toda confianza, lleva información 
sobre la caldera de presión independientemente de lo que la gente crea, o 
no crea, de hecho sobre el funcionamiento del aparato. Las dudas del in- 
geniero sobre la fiabilidad del calibrador son sólo eso, dudas. No convier- 
ten al calibrador en algo poco fiable. No crean equivocidad. Lo que hace 
que un puente sea poco seguro son sus características (por ejemplo, los 
defectos de su estructura), no el miedo de la gente que pasa por él. Y lo 
que hace que un sistema de comunicación sea equívoco son sus caracterís- 
ticas, no las sospechas (por bien fundadas que sean) de los receptores po- 
tenciales. Nadie cruzaría el puente si tuviera un miedo suficientemente 
grande, y nadie usaría (o confiaría en) un canal de comunicación si le re- 
sultara suficientemente sospechoso, pero tales hechos no son pertinentes 
para la calidad del canal de comunicación como lo son para la seguridad 
del puente. 

Las dudas de nuestro ingeniero pueden inducir a otros a desconfiar del 
calibrador. Si tal cosa sucede, esas personas no podrían saber lo que el 
empleado sabe, no porque no tengan acceso a la información, sino porque 
la información de que la presión es normal (a la que ellos tienen acceso, al 
igual que el empleado, si miran lo que marca el calibrador) no llega a pro- 
ducir en ellas la creencia requerida. Si esas sospechas (sobre la fiabilidad 
del calibrador) le son comunicadas al empleado, es posible que deje de ser 
razonable su pretensión de que sabe (ya que ha dejado de ser razonable el 
que piense que está obteniendo la información requerida para saber), pero 
si persistiera obstinadamente (y, quizás, irracionalmente) en confiar en el 
calibrador, sabría lo que nadie más sabe: que la presión de la caldera es la 
normal. Cuando las sospechas no afectan ni a la causa (información) ni al 
efecto (creencia), son incapaces de destruir el conocimiento resultante. 
Como mucho, socavan nuestro conocimiento de que sabemos O nuestras 
razones para creer que sabemos. 

Sin embargo, a pesar de la inmunidad de la información (y, por tanto, 
del conocimiento) respecto a las dudas escépticas sobre la presencia de 
información (o conocimiento), hay una observación válida que hacer en 
relación a la integridad del canal. He intentado reconocerlo al describir 
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posibilidades alternativas (la ausencia de las cuales define una condición 
de canal, y la eliminación de las cuales define la información) como posi- 
bilidades pertinentes o genuinas. La sospecha filosófica puede haberse ya 
suscitado por mi uso alegre de esos calificativos. Después de todo, ¿qué es 
una posibilidad pertinente? ¿Cuándo tiene genuinos estados alternativos 
una condición existente? Si, por medio de una calibración inicial, alguien 
ya ha determinado que una condición está en el estado C, ¿hasta qué mo- 
mento su permanencia en ese estado no genera nueva información (de esta 
forma, puede calificarse como condición de canal)? Si es redundante in- 
formativamente el volver cada veinte segundos a la puerta cerrada, 
¿cuándo comenzamos a obtener nueva información, información respecto 
a que todavía está cerrada? ¿A los veinte minutos? ¿A los veinte días? ¿A 
los veinte años? 

No hay nada particularmente original en la idea de que el conocimiento 
incorpora la exclusión de alternativas pertinentes (a lo que se sabe). Lo 
que puede resultar algo más novedoso es la sugerencia de que el conoci- 
miento hereda esa propiedad de las fuentes de la teoría de la información, 
la idea de que la distinción entre una alternativa pertinente y una que no lo 
es (en su relación con investigaciones cognitivas) es exactamente la dis- 
tinción entre una fuente (respecto a la que se recibe la información) y un 
canal (a través del cual se recibe la información). La fuente, como genera- 
dor de información nueva, es el locus de las posibilidades alternativas per- 
tinentes, dado que son esas alternativas las que se supone que la señal debe 
eliminar. Siendo el canal el conjunto de condiciones (de las que depende 
la señal) que no tienen estados alternativos pertinentes —por lo que no 
generan nueva información —, constituye el marco de referencia fijo den- 
tro del que se determinan las relaciones de dependencia entre la fuente y 
el receptor. Al articular su propio análisis del conocimiento, A. Goldman 
alude a la importancia del concepto de alternativas pertinentes.”* Una al- 
ternativa pertinente es, según Goldman, aquella que el sujeto del conoci- 
miento debe poder excluir en base a evidencia para poder poseer realmente 
el conocimiento que le atribuimos. Como sugiere la terminología, esto 
quiere decir que hay algunas alternativas no pertinentes tales que no es 
necesario que el sujeto esté en posición de excluirlas para poder conocer. 





2 «Discrimination and Perceptual Knowledge», The Journal of Phi- losophy, vol. 73, n*20 
(1976). 
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Goldman ilustra este extremo cuando imagina el siguiente tipo de situa- 
ción. Mientras conduzco por el campo de Wisconsin me doy cuenta de 
(Mego a saber) que algunas construcciones son graneros a la vez que soy 
plenamente consciente de que no puedo excluir la posibilidad de que lo 
que he visto no sea más que un conjunto de reproducciones detalladas que 
los especialistas de Hollywood han construido para engañar a los turistas 
que pasen por allí. Sin embargo, en la mayoría de las situaciones esta po- 
sibilidad no es una alternativa pertinente. Si de hecho existieran tales re- 
producciones, y se encontraran en diversos lugares del campo de Wiscon- 
sin (y no sólo en los emplazamientos de Hollywood), tal alternativa se 
convertiría en una posibilidad relevante. En ese caso yo debería ser capaz 
de afirmar que el edificio que estaba mirando no era una reproducción sa- 
biamente disimulada, algo que normalmente no estoy en posición de afir- 
mar. Además, la cuestión de cuándo una alternativa irrelevante se con- 
vierte en algo relevante es un asunto de grado. Si tales reproducciones 
existieran en lowa, pero no en Wisconsin, ¿sería posible decir (por una 
observación accidental desde la carretera) que algo era un granero en Wis- 
consin? ¿Y sí las reproducciones sólo existieran en Suecia? 

O consideremos el siguiente tipo de situación.” Alguien lleva a su hijo 
al zoo y allí ve varias cebras. Cuando el niño pregunta, le dice que son 
cebras. ¿Sabe que son cebras? Es obvio que la mayoría de nosotros ten- 
dríamos pocas dudas a la hora de afirmar que lo sabíamos. Sabemos qué 
aspecto tienen las cebras y, además, estamos en el zoo de la ciudad (no en 
Disneylandia) y hay un letrero en el que está escrito claramente «Cebras». 
Sin embargo, que algo sea una cebra implica que no es una muía y, en 
particular, que no es una muía sabiamente disimulada por las autoridades 
del zoo. ¿Sabe nuestro hombre que los animales no son muías sabiamente 
disimuladas por las autoridades del zoo para que tengan el aspecto de ce- 
bras? ¿Puede eliminar esa posibilidad? Si no es posible, ¿cómo puede lle- 
gar a la información (y, por tanto al conocimiento) de que son cebras? Y 
si el engaño por las autoridades del zoo no es una posibilidad pertinente, 
¿por qué no lo es? ¿Porque el director del zoo no es un bromista notorio? 

Tales ejemplos pueden parecer tontos, pero ilustran un aspecto impor- 
tante sobre las señales transmisoras de información. Ninguna señal puede 





25 Este ejemplo está tomado, con pequeñas modificaciones, de mi «Epistemic Operators», 
The Journal of Philosophy, diciembre 24, 1974. 
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excluir todas las posibilidades si las posibilidades se identifican con lo que 
se puede imaginar coherentemente. Ninguna señal, por ejemplo, puede eli- 
minar la posibilidad de que hubiera sido generada, no por los medios ha- 
bituales, sino por algún tipo de accidente cósmico, por un demonio enga- 
ñoso o por la intervención sobrenatural. Si tales contingencias son consi- 
deradas posibilidades genuinas, toda señal es ambigua. 

El modo en que la teoría de la comunicación evita este resultado es 
considerar lo que sucede (y no sucede) de hecho (a un término suficiente- 
mente largo) como un índice de lo que puede (y no puede) suceder. Por 
supuesto, no es en modo alguno una guía completamente infalible, dado 
que posibilidades extrañas, pero perfectamente genuinas, pueden no mate- 
rializarse a lo largo de cualquier muestra finita. Que Elmer haya identifi- 
cado correctamente cien cartas extraídas al azar en una habitación lejana, 
puede sugerir que está (de algún modo) obteniendo información sobre las 
cartas. Podemos considerarlo como evidencia de que lo está haciendo, pero 
no constituye una demostración de lo que esté haciendo. Después de todo, 
es posible que se equivoque en el centenar siguiente. Sin embargo, aunque 
el procedimiento no sea infalible, tiene el mérito de situar la cuestión de 
qué es posible, de qué constituye una genuina equivocidad en la señal, 
fuera de las manos de la especulación vacía (escéptica o de otro tipo) y 
colocarla donde debe estar: en el canal de comunicación cuya fiabilidad se 
cuestiona. Tiene la virtud de hacer que un canal de comunicación sea 
inocente hasta que se demuestre su culpabilidad. Esto no quiere decir que 
una señal sea inequívoca hasta que demuestra ser equívoca. Más bien, 
quiere decir que una señal no es equívoca meramente porque no se ha mos- 
trado, y quizá no pueda mostrarse que sea equívoca. El hecho de que po- 
demos imaginar circunstancias en las que una señal sería equívoca, el he- 
cho de que podemos imaginar posibilidades que no son eliminadas por la 
señal no muestra, por sí mismo, que la señal sea equívoca. Lo que se ha de 
demostrar es que estas circunstancias imaginadas pueden ocurrir, que se 
dan estas posibilidades imaginadas. Si un tipo determinado de señal ha 
ocurrido sólo cuando s era F, la presuposición, por lo menos, es que puede 
ocurrir sólo cuando s es F. Esta presuposición puede ser equivocada, pero 
se necesita algo más que una vivida imaginación para mostrar que es un 
error. El peso de la prueba ha pasado a aquellos que impugnarían la validez 
de un canal que ha sido de confianza hasta el presente. 
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La cuestión acerca de cuándo un canal es lo suficientemente seguro 
como para transmitir información del tipo requerido para el conocimiento 
(ambigiúedad cero) es, en general, una cuestión empírica. No puede ser 
decidida imaginando posibilidades o ignorándolas. Para ser calificada 
como una posibilidad pertinente, una que realmente afecte a la equivoci- 
dad de una señal (y en consecuencia a la información que hay en ella), la 
posibilidad vistumbrada debe ser realmente realizable en los componentes 
internos del sistema particular en cuestión. Si, en el pasado, se recibieron 
señales del tipo R cuando s no era F (el que tal cosa se sepa o no, no es 
relevante), esto decide el asunto. Las señales del tipo R son equívocas 
con respecto a que los s sean F, y son equívocas tanto si en esta ocasión s 
resulta ser F como si no. Pero si, en el pasado, las señales de tipo R se han 
recibido sólo cuando s era F, la cuestión es menos clara. En tanto que sea- 
mos conscientes de la regularidad pasada, existirá la suposición de que la 
señal es inequívoca. Y se requerirá bastante consideración positiva, con- 
trarrestante, para socavar la razonabilidad de creer que R transporta en ver- 
dad la información de que s es F. Pero nada de esto es concluyente. Des- 
pués de todo, ¿cómo podemos evaluar la afirmación de que la lectura de 
este determinado manómetro, el testimonio de esta persona concreta o 
aquella experiencia sensorial particular podrían estar en error, son equívo- 
cas, si no existiera un registro pasado de tales errores para ese manómetro, 





26 A menos que, desde luego, las circunstancias hayan cambiado, o se esté operando en un 
contexto mucho más restringido en el que una señal que de otra forma es equívoca, se con- 
vierta en fiable. En Seeing and Knowing (Chicago, 1969) ilustré este efecto describiendo a 
un trabajador de una cadena de montaje que pudiese reconocer resistencias cuando aparecie- 
sen en la cadena de montaje, pero cuyas habilidades cognitivas fuesen considerablemente 
más reducidas fuera de la fábrica. Su habilidad para reconocer resistencias en la fábrica ha 
de explicarse por el hecho de que en esa fábrica, en esa línea de montaje, no se permite la 
aparición de nada que él pudiese confundir con una resistencia (dentro de la fábrica no existe 
equivocidad). Sin embargo, dado que él no conoce la diferencia entre una resistencia y un 
condensador, y que algunos condensadores se parecen mucho a resistencias, no puede (fuera 
de la fábrica) reconocer una resistencia (incluso aquellas que él llama correctamente resis- 
tencias). Entonces, si incluimos el estar en la fábrica como una de las condiciones del canal 
(algo que podríamos hacer de forma explícita diciendo «En la fábrica puede apreciar la dife- 
rencia»), como algo que mantenemos fijo de forma tácita al estimar la equivocidad, no hay 
nada que nos impida decir que (en la fábrica) él está obteniendo la información de que s es 
una resistencia. Al caracterizar las capacidades cognitivas de un organismo, a menudo esta- 
blecemos estipulaciones similares (explícita o implícitamente) sobre su hábitat natural. 
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esa persona (sobre este tema, en estas circunstancias) o ese tipo de expe- 
riencia sensorial? Si Elmer nunca ha sufrido alucinaciones sobre la exis- 
tencia de patatas fritas en el plato de su cena, ¿es suficiente el que otros 
las hayan sufrido (si no patatas fritas en su plato, cosquilleos en su brazo) 
para convertirlo en una posibilidad real en el caso de Elmer? ¿Es suficiente 
para mostrar que la experiencia de Elmer de las patatas fritas en el plato 
de su cena es equívoca y, por lo tanto, carece de la información de que él 
tiene patatas fritas en el plato de su cena? El hecho de que las agujas de 
algunos manómetros se han atascado, ¿es suficiente para mostrar que la 
aguja de este manómetro podría estar atascada? ¿Por qué no muestra sim- 
plemente que algunos manómetros no son de confianza? 

Es precisamente en este punto donde nuestro análisis de un sistema de 
comunicación comienza a revelar lo que algunos filósofos llaman un as- 
pecto «social» o «pragmático». Una serie de investigadores han puesto de 
relieve tanto la dependencia del contexto como el carácter relativo a ciertos 
intereses del conocimiento.” El que alguien sepa algo (no: el que se diga, 
o se piense razonablemente, que se sabe) parece depender de factores tan 
extraños (extraños, por lo menos, desde el punto de vista de una teoría de 
la información) como lo que todos los demás saben o asumen, la impor- 
tancia de lo que es conocido (o la importancia de que alguien lo sepa) y la 
proximidad o disponibilidad de evidencia (información) que no poseemos. 
Todas estas consideraciones son cuestiones de grado y, en este sentido, 
parecen infringir los requisitos absolutos de una teoría del conocimiento 
basada en la información. Si el técnico sabe cuál es el voltaje gracias al 
uso de un instrumento recién adquirido y calibrado, ¿por cuánto tiempo 
podemos seguir usándolo (sin calibrarlo de nuevo o comprobar su buen 
funcionamiento) y continuar sabiendo? ¿Por cuánto tiempo continuará 
transmitiendo la información precisada? Si permanecer en la tienda sin uso 
alguno durante veinte años es un período demasiado largo (puede que los 
contactos se hayan corroído, que algunos componentes se hayan oxidado, 





27 Aparte de mí mismo y Goldman, Ernest Sosa en «How Do You Know?», The American 
Philosophical Quarterly, vol. 11.2 (1974), Gilbert Harman en Thought, D. M. Armstrong en 
Belief, Truth and Knowledge, Cambridge, 1973, capítulo 12, y muchos otros. Muchos de los 
análisis del conocimiento conocidos como falibilidad se ocupan del mismo tipo de cuestiones 
(con diferente terminología); véase, por ejemplo, Marshall Swain, «Epistemic Defeasibility», 
The American Philosophical Quarterly, vol. 11.1 (1974) para una reseña de tales intentos y 
una bibliografía útil. 
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etc.), ¿cuándo cesa de pasar información a través de él? ¿Cómo puede el 
conocimiento ser identificado con creencia producida por información si 
el conocimiento posee esta dimensión social, relativa, pragmática, mien- 
tras que la información no la tiene? 

La respuesta, desde luego, es que la información tiene este mismo ca- 
rácter. El que una señal lleve o no una información determinada depende 
de qué es lo que sea el canal entre fuente y receptor, y la cuestión de si una 
condición existente es lo bastante estable o permanente como para ser ca- 
lificada como parte del canal, como una condición que en sí misma no 
genera información nueva, es una cuestión de grado, una cuestión sobre la 
cual las personas (dados sus diferentes intereses y propósitos) pueden ra- 
zonablemente discrepar, una cuestión que puede no tener una respuesta 
correcta de forma objetiva. Cuándo una posibilidad deviene una posibili- 
dad pertinente es una cuestión que depende, por lo menos en parte, de los 
intereses, los propósitos y los valores de aquellos que tienen algo que ver 
con el proceso de comunicación. El flujo de la información es un proceso 
que se ve afectado por los diferentes propósitos de los que envían la infor- 
mación y los que la reciben. 

Sin embargo, de lo que hemos de darnos cuenta es de que esta relativi- 
dad no está en conflicto con el pretendido carácter absoluto del conoci- 
miento o de la información de la que éste depende. Estar vacío es no con- 
tener ninguna cosa, y, en este sentido, el que algo esté vacío no es una 
cuestión de grado. Sin embargo, el que algo cuente como una cosa para el 
propósito de determinar si algo está vacío es una cuestión de grado, una 
cuestión acerca de la cual la gente (dados sus diferentes intereses y propó- 
sitos) podría discrepar fácilmente, una cuestión que puede no tener una 
respuesta objetivamente correcta. Estar vacío es carecer de todas las cosas 
pertinentes. El concepto, aunque absoluto, posee una plasticidad interna 
(en la idea de objeto «pertinente») que es sensible a los intereses y propó- 
sitos de las personas que lo utilizan. El conocimiento y la información no 
son diferentes. Saber, o haber recibido información, es haber eliminado 
todas las posibilidades alternativas pertinentes. Estos conceptos son ab- 
solutos. Lo que no es absoluto es la forma en que los aplicamos a situacio- 
nes concretas, la forma en que determinamos lo que se calificará como una 
alternativa pertinente. 

Por tanto, las dimensiones sociales o pragmáticas del conocí miento no 
son incompatibles ni con la letra ni con el espíritu de las explicaciones 
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basadas en una teoría de la información. Por el contrario, esta dimensión 
de nuestro concepto del conocimiento (y de conceptos cognitivos relacio- 
nados: reconocimiento, percepción, descubrimiento, etc.) ha de ser expli- 
cada rastreándola hasta su fuente en la teoría de la comunicación. El co- 
nocimiento posee este carácter pragmático porque un sistema de comuni- 
cación, cualquier sistema de comunicación, presupone una distinción en- 
tre una fuente sobre la que se recibe información y un canal a través del 
cual se recibe esta información. La fuente es el generador de información 
(nueva). El canal es el conjunto de condiciones existentes que no genera 
información (nueva). Sin embargo, decir que una condición existente no 
genera información nueva, es decir, que no posee estados alternativos per- 
tinentes (por lo menos ninguno que no haya sido eliminado por informa- 
ción anteriormente recibida). Es en la determinación de lo que constituye 
una alternativa pertinente, una determinación esencial para el análisis de 
cualquier sistema procesador de información (tanto si resulta en conoci- 
miento como si no), donde encontramos la fuente de la «flexibilidad», de 
otro modo desconcertante, de nuestros conceptos cognitivos absolutos.” 





2 Estoy agradecido a Fred Adams por renunciar a darse por satisfecho con una versión del 
presente capítulo que era incluso menos adecuada que la presente. 
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6. Sensación y percepción 


Los modelos de la actividad mental como procesado de información 
tienden a mezclar fenómenos sensoriales y de percepción, por una parte, 
con fenómenos cognitivos y conceptuales, por otra. La percepción está re- 
lacionada con la recogida y envío de información; la cognición, con su 
utilización. Pero se nos dice que éstos no son más que diferentes niveles 
en un proceso que trata información más o menos continuamente.” Reco- 
nocimiento, identificación y clasificación (actividades cognitivas) ocurren 
en cada pase del proceso perceptual. Ver y oír son formas de conocimiento 
de grado inferior. 

Pienso que esto es una confusión. Una confusión que oscurece el papel 
distintivo de la experiencia sensorial en todo el proceso cognitivo. Para 
clarificar este punto, será necesario examinar la forma en que la informa- 
ción puede ser transmitida y convertida en algo accesible a centros cogni- 
tivos sin estar calificada en sí misma para recibir los atributos cognitivos, 
es decir, sin tener ella misma el tipo de estructura asociado con el conoci- 
miento y la creencia. Para este propósito debemos decir algo sobre las di- 
ferentes formas en que la información puede ser codificada. 


Codificación analógica y digital 


Lo tradicional es considerar la diferencia entre codificación de infor- 
mación analógica y codificación de información digital como la diferencia 
entre una representación continua y una representación discreta de alguna 
propiedad variable en la fuente. De esta forma, por ejemplo, el velocímetro 
en un automóvil constituye una codificación analógica de información so- 
bre la velocidad del vehículo porque las diferentes velocidades son repre- 





2 La siguiente postura es típica: «Sensación, percepción, memoria y pensamiento deben 
considerarse continuos de actividad cognitiva. Son mutuamente interdependientes y no se 
pueden separar excepto con reglas arbitrarias y por conveniencia momentánea». R. N. Haber, 
«Introduction», en Information Processing Approaches to Visual Perception, R. N. Haber 
(ed.), Nueva York, 1969. 
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sentadas por diferentes posiciones de la aguja. La posición de la aguja va- 
ría de forma continua (más o menos), y cada una de sus diferentes posicio- 
nes representa un valor diferente para la cantidad que se representa. La luz 
en el tablero de instrumentos que registra la presión del aceite, por otra 
parte, es un instrumento digital, dado que sólo posee dos estados de infor- 
mación pertinente (encendida y apagada). Estos estados son discretos por- 
que no existen estados intermedios de información pertinentes. Desde 
luego, se podría explotar el hecho de que las luces tienen una intensidad 
variable. Esta propiedad continua de la señal podría usarse para representar 
la cantidad de la presión del aceite: ¡cuanto más brillante sea la luz, menor 
la presión del aceite! Usada de esta forma, la luz estaría funcionando, por 
lo menos en parte, como una representación analógica de la presión del 
aceite. 

La distinción entre analógico y digital se usa generalmente para señalar 
una diferencia en la forma en que se lleva la información sobre una pro- 
piedad, magnitud o cantidad variable: tiempo, velocidad, temperatura, pre- 
sión, altura, volumen, peso, distancia, etc. Los termómetros de uso ordina- 
rio son instrumentos analógicos: la altura variable del mercurio representa 
la temperatura variable. Las manecillas del reloj llevan información sobre 
el tiempo de forma analógica, pero los despertadores seleccionan parte de 
esa información y la transmiten en forma digital. 

Sin embargo, no estoy interesado en la información sobre propiedades 
y magnitudes y las diferentes formas en que ésta pueda ser codificada, sino 
en información sobre la instanciación de esas propiedades y magnitudes 
por elementos particulares en la fuente de origen. En otras palabras, no 
estoy interesado en cómo podamos codificar la información sobre la tem- 
peratura, sino en cómo podamos representar el hecho de que la temperatura 
es demasiado alta, más de 1009, o exactamente 153”. Lo que queremos es 
una distinción, similar a la distinción analógico-digital en su relación con 
la representación de propiedades, para señalar las diferentes formas en que 
los hechos pueden ser representados. ¿Podemos decir, por ejemplo, que 
una estructura lleva la información de que s es F en forma digital y que 
otra la lleva en forma analógica? 

Para el propósito de señalar una diferencia importante en la forma en 
que la información puede ser codificada en una señal o estructura, pro- 
pongo usar la conocida terminología —analógico versus digital— en una 


— 163 — 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


forma ligeramente heterodoxa. La justificación para extender la vieja ter- 
minología para cubrir lo que es básicamente una distinción diferente se irá 
aclarando con la marcha de nuestra exposición. 

Diré que una señal (estructura, evento, estado) lleva la información de 
que s es F en forma digital sí y sólo si la señal no lleva ninguna informa- 
ción adicional sobre s, ninguna información que no esté ya incluida en que 
s es F. Si la señal sí lleva información adicional sobre s, información que 
no está incluida en «s es F», entonces diré que la señal lleva esta informa- 
ción de forma analógica. Cuando una señal lleva la información de que s 
es F de forma analógica, la señal siempre lleva información más especí- 
fica, más determinada sobre s que es F. Cada señal lleva información en 
ambas formas, analógica y digital. El elemento más específico de informa- 
ción que la señal lleva (sobre s) es el único elemento de información que 
lleva (sobre s) en forma digital'%. Toda la información restante (sobre s) 
está codificada de forma analógica. 

Para ilustrar la forma en que se aplica esta distinción, considérese la 
diferencia entre un cuadro o pintura y un enunciado. Supongamos que una 
taza contiene café y queremos comunicar esta información. Si simple- 
mente le digo «La taza contiene café», esta señal (acústica) transmite la 
información de que la taza contiene café de forma digital. No se suministra 
ninguna información más específica sobre la taza (o el café) que la de que 
hay algo de café en la taza. No se nos dice cuánto café hay en la taza, el 
tamaño de ésta, cuán oscuro es el café, cuál es la forma y la orientación de 
la taza, etc. Por otra parte, si tomo una fotografía de la escena y la enseño, 
la información de que la taza contiene café se transmite de forma analó- 
gica. La fotografía nos dice que hay algo de café en la taza, a la vez que 
nos dice, de forma aproximada, cuánto café hay en ella, la forma, tamaño 
y color de la taza, etc. 

Puede decir que A y B son de tamaño diferente sin decir cuánto difieren 
en tamaño o cuál es mayor, pero no puedo dibujar A y B siendo de tamaño 
diferente sin dibujar una de ellas mayor que la otra e indicando, aproxima- 
damente, la diferencia de tamaño. De forma similar, si una pelota amarilla 
es situada entre una roja y una azul, puedo enunciar que esto es así sin 





100 A quí, es necesario que escribamos «sobre s» entre comillas porque, como veremos más 
adelante (capítulo 7), la información sobre s que está codificada en forma digital podría estar 
incluida, sin embargo, en la información sobre alguna otra cosa. 
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revelar donde está la pelota azul (si a la izquierda o a la derecha). Pero si 
esta información ha de ser comunicada de forma pictórica, la señal ha de 
ser necesariamente más específica. Una de las dos pelotas —la azul o la 
roja— ha de ser pintada a la izquierda. Para hechos de este tipo, una pintura 
es, por necesidad, una representación analógica. Los enunciados corres- 
pondientes («A y B tienen tamaños diferentes», «La pelota amarilla está 
situada entre la roja y la azul») son representaciones digitales de los mis- 
mos hechos. 

Como se ha indicado, una señal que lleva información de forma analó- 
gica siempre transportará alguna información de forma digital. Una ora- 
ción que expresase toda la información que una señal lleva sería una ora- 
ción que expresaría la información que la señal lleva en forma digital (dado 
que ésta sería la información más específica, más determinada que la señal 
lleva). Esto es cierto tanto en el caso de las fotografías como en el de otras 
representaciones analógicas. La información que una fotografía lleva en 
forma digital tan sólo podría ser interpretada por alguna oración enorme- 
mente compleja, una oración que describiese cada detalle de la situación 
sobre la que la fotografía lleva información. Decir que una imagen vale 
por mil palabras sólo es reconocer que, por lo menos en la mayoría de los 
casos, la oración requerida para expresar toda la información contenida en 
la imagen tendría que ser en verdad muy compleja. La mayoría de las imá- 
genes poseen una riqueza de detalles y un grado de especificidad que im- 
piden la posibilidad de dar una versión lingúística tan sólo aproximada de 
la información que la imagen lleva en forma digital. Típicamente, al des- 
cribir la información representada por una imagen, describimos la infor- 
mación que ésta lleva en forma analógica, abstrayendo, de alguna forma, 
su más concreta contextualización en la imagen. 

No estamos diciendo que no se puedan desarrollar medios alternativos 
de codificar la información que una imagen lleva en forma digital. Podría- 
mos construir un aparato (un sistema de alarma, por ejemplo) que fuese 
activado tan sólo cuando se diese una situación en la fuente que fuese exac- 
tamente como la representada en la imagen (siendo las únicas variaciones 
permitidas aquellas sobre las que la imagen no llevase ninguna informa- 
ción). La alarma, al sonar, llevaría exactamente la misma información que 
la imagen, y ambas estructuras (una pictográfica, la otra no) llevarían esta 
información en forma digital. Programas de computadores de reconoci- 
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miento que descansan en rutinas de integración de plantilla entera se apro- 
ximan a este tipo de transformación.'%! La información entrante se sumi- 
nistra en forma pictórica (letras del alfabeto o patrones geométricos). Si 
existe una correlación exacta entre los patrones de entrada y la plantilla 
almacenada, el computador «reconoce» el patrón y le da el rótulo apro- 
piado. El rótulo asignado al patrón de entrada corresponde a nuestro sis- 
tema de alarma. La salida (rótulo) lleva la misma información que el pa- 
trón de entrada. La información que la imagen transporta en forma digital 
ha sido transformada físicamente. 

Sin embargo, como todo el mundo reconoce, estos procesos de ajuste 
de plantilla tienen muy poco que ver con el reconocimiento genuino. En 
tanto que lo que salga (algún rótulo identificador) lleva toda la informa- 
ción contenida en el patrón de entrada, no tenemos nada correspondiente 
a los estímulos de generalización, categorización o clasificación. Desde 
luego, lo que queremos, es un programa de computador que «reconozca» 
no tan sólo una letra A en este tipo de fundición, en esta orientación y en 
este tamaño (la única cosa a la que la plantilla almacenada se ajustará exac- 
tamente), sino la letra A en diferentes tipos de fundición, en diversas orien- 
taciones y en una variedad de diferentes tamaños. Para este propósito ne- 
cesitamos algo que extraiga la información que el patrón de entrada lleva 
en forma analógica. Queremos algo que elimine los rasgos no pertinentes 
de esta A particular (no pertinentes en tanto que es una ejemplificación de 
la letra A) para responder a aquellos rasgos particulares relacionados de 
forma relevante con el hecho de que el patrón es una instancia de la letra 
A. En otras palabras, queremos un sistema de alarma que responda a los 
elementos de información que las imágenes (patrones) transportan en 
forma analógica. 

Para comprender la importancia de la conversión de lo analógico en 
digital, y para apreciar su relevancia para la distinción entre procesos per- 
ceptuales y cognitivos, consideremos el siguiente mecanismo simple. Una 
fuente variable es capaz de asumir cien valores diferentes. La información 
sobre esta fuente es suministrada a un sistema procesador de información. 
El primer nivel de este sistema contiene un aparato que registra de forma 
precisa el estado de la fuente. El lector puede imaginarse a la fuente como 





101 Ver Leonard Uhr, Pattern Recognition, Learning, and Thought, Englewood Cliffs, N.J., 
1973, capítulo 2. 
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la velocidad de un vehículo (capaz de ir de O a 99 millas por hora), y al 
primer nivel de nuestro sistema procesador de información como un velo- 
címetro capaz de registrar (a través de una aguja que se mueve) la veloci- 
dad del vehículo. Después, esta información es suministrada a un conver- 
tidor. El convertidor consiste de cuatro tonos de diferente intensidad, y un 
mecanismo para activar estos diversos tonos. Si la fuente está en el rango 
de 0 a 14, se oye el tono de intensidad más baja. Un tono de mayor inten- 
sidad ocurre en el rango de 15- 24, un tono de intensidad todavía mayor de 
25 a 49, y el más alto de 50 a 99. Estos diferentes rangos pueden imagl- 
narse como los rangos aproximados en los que uno estaría en la primera, 
segunda, tercera y cuarta marcha, y el convertidor puede imaginarse como 
un aparato para alertar a los conductores novatos (a través de las notas de 
diferente tono) de la necesidad de cambiar la marcha. La corriente de la 
información tendría una forma parecida a la de la figura 6-1. 





Fuente 
Representación Convertidor 
analógica digital 

31 = 2,75 bits 

6,65 34+2= 3,32 bits 
383 = 2,0 bits 
344 =1,0 bits 

(FIG. 6.1) 


Lo que he llamado la «representación analógica» (el velocímetro) lleva 
toda la información generada por la fuente variable. Dado que la fuente 
tiene cien posibles estados diferentes (todos con la misma probabilidad de 
ocurrencia), el velocímetro lleva 6,65 bits de información sobre la fuente. 
Lleva la información de que el vehículo va a, por ejemplo, 43 millas por 
hora. Esta información es suministrada al convertidor y (asumiendo una 
velocidad de 43 millas por hora) el tercer tono es activado. Dado que el 
tercer tono se activa cuando, y sólo cuando, el vehículo posee una veloci- 
dad en el rango de 25-49, este tono lleva dos bits de información sobre la 
velocidad del vehículo (una reducción de cien posibilidades igualmente 
probables a 25). 
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La salida de este sistema siempre es menor, de forma cuantitativa, que 
la entrada. Aunque 6,65 bits de información entran, algo menos que esto 
es lo que sale. Lo que se gana con la pérdida de información es una clasi- 
ficación (en los diversos tonos) de los rangos significativos de la variable 
de entrada. Ésta es una forma de estímulo de generalización, aunque una 
forma bastante primitiva. La salida de este sistema ignora la diferencia en- 
tre 43 y 32 millas por hora. Ambos valores son tratados esencialmente de 
la misma forma. Ambos activan el tono 3. Desde el punto de vista de la 
información que el sistema está diseñado para comunicar, el velocímetro 
interno es una representación analógica de la fuente porque lleva informa- 
ción sobre la fuente más específica y determinada de lo que se requiere 
para controlar la salida del sistema. El velocímetro «dice» que el vehículo 
va a 43 millas por hora. Inserta dentro de esta información, se encuentra la 
información de que el vehículo va entre 25 y 50 millas por hora. El con- 
vertidor digital sólo está interesado en la última información. «Elimina» la 
información más específica y transmite una información (que el vehículo 
va a una velocidad entre 25 y 50 millas por hora) que el velocímetro lleva 
en forma analógica. Desde luego, el velocímetro lleva la información de 
que el vehículo va 43 millas por hora en forma digital (dado que no lleva 
información más específica sobre la velocidad del vehículo), pero en rela- 
ción a la información que este sistema está diseñado para comunicar (por 
ejemplo, si la velocidad es entre 15 y 24 6 entre 25 y 49) el velocímetro 
constituye una representación analógica del estado de la fuente. El sistema 
está actuando sobre la información que el velocímetro lleva en forma ana- 
lógica y es ésta la que conduce sus centros motores (los diversos zumba- 
dores). Las informaciones más específicas que transportan son sistemáti- 
camente ignoradas para alcanzar una respuesta uniforme a las similitudes 
pertinentes. 

Describir un proceso en el que una información es convertida de la 
forma analógica a la digital es describir un proceso que necesariamente 
envuelve una pérdida de información. La información se pierde porque 
pasamos de una estructura (el velocímetro) de mayor contenido informa- 
tivo a otra de menor contenido informativo. La conversión digital es un 
proceso en el que las informaciones no pertinentes se dejan de lado y se 
descartan. Hasta que la información se haya perdido, o desechado, un sis- 
tema de procesado de información no puede tratar cosas diferentes como 
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esencialmente la misma. No puede clasificar o categorizar, no puede «re- 
conocer» la entrada como un caso de un tipo más general. El sistema sim- 
ple que acabamos de describir realiza este proceso de una forma comple- 
tamente mecánica. Sin embargo, aunque adolece de los rasgos esenciales 
de un sistema perceptivo-cognitivo genuino, ilustra los procesos de análi- 
sis de información que están en la base de todos los estímulos de genera- 
lización, clasificación y reconocimiento. 


Procesos sensoriales versus procesos cognitivos 


El contraste entre una codificación de información analógica y una di- 
gital (tal como las acabamos de definir) es útil para distinguir entre proce- 
sos sensoriales y cognitivos. La percepción es un proceso a través del cual 
se distribuye información dentro de una matriz de información más rica 
(por lo tanto, en forma analógica) a los centros cognitivos para su uso se- 
lectivo. Ver, oír y oler son formas diferentes por las que obtenemos infor- 
mación sobre s para una unidad de conversión digital cuya función es ex- 
traer la información pertinente desde la representación sensorial con el 
propósito de modificar el resultado. Lo que constituye la esencia de la ac- 
tividad cognitiva es la conversión con éxito de la información en forma 
digital (apropiada).'% Si la información de que s es F no se transforma 
nunca de una forma sensorial (analógica) a una forma cognitiva (digital), 
aunque el sistema en cuestión pueda haber visto, oído u olido un s que es 
F, no ha visto que es F: no sabe que es F. La idea tradicional de que el 
conocimiento, la creencia y el pensamiento implican conceptos mientras 
que la sensación (o la experiencia sensorial) no, está reflejada en esta di- 
ferencia de codificación. La actividad cognitiva es la movilización con- 





102 L o que califica a un sistema de perceptivo-cognitivo no es meramente la conversión de 
la información de la forma analógica a la digital. El sistema del sonido-velocímetro descrito 
anteriormente ni ve ni sabe que el vehículo va a una velocidad entre 25 y 49 millas por hora 
cuando se activa el tercer tono. Para ser calificado de sistema perceptivo genuino, es necesa- 
rio que exista una unidad de conversión digital en la que se le pueda dar un cuerpo cognitivo 
a la información, pero el cuerpo cognitivo de información no es simplemente una cuestión de 
digitalización. Las condiciones adicionales que deben ser satisfechas para calificar una es- 
tructura como estructura cognitiva (aparte de la digitalización) serán discutidas en la tercera 
parte. 


— 169 — 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


ceptual de la información entrante, y este tratamiento conceptual es fun- 
damentalmente una cuestión de ignorar diferencia (en tanto que no perti- 
nentes para una igualdad subyacente), de ir desde lo concreto a lo abs- 
tracto, de pasar de lo particular a lo general. En suma, es una cuestión de 
realizar la transformación de lo analógico a lo digital. 

La sensación, lo que el hombre ordinario quiere decir cuando habla de 
la apariencia (sonido, olor, etc.) de las cosas, y a lo que el psicólogo se 
refiere como el percepto o (en algunos contextos) el almacenamiento de la 
información sensorial (SIS),!% es, desde el punto de vista informacional, 
tan profusa y específica como una representación pictórica. Por otra parte, 
el conocimiento y la creencia son selectivos y exclusivos de la misma 
forma que un enunciado. «El tapiz de la conciencia es rico, pero el proceso 
de reconocimiento del patrón, dependiente de la clasificación, está relati- 
vamente empobrecido en el detalle con el que opera!%*.» Nuestra experien- 
cia sensorial implica información sobre una variedad de detalles que, si se 
transmitiesen en su totalidad a los centros cognitivos, requerirían una gi- 
gantesca capacidad de almacenamiento y recuperación!'%. En el almacén 
sensorial existe más información de la que puede ser extraída, lo que es un 
límite a la cantidad de información que puede ser explotada por los meca- 
nismos cognitivos. !% 





103 También ha sido llamado Almacén Acústico Precategorial (por R. G. Crowder y J. Mor- 
ton), «Precategorial Acoustic Storage (PAS)», Perception and Psychophysics, vol. 5 (1969), 
págs. 365-373. Roberta Klatzk y (Human Memory, San Francisco, 1975) señala que el término 
precategorial es importante «porque implica que la información retenida en los registros no 
se retiene como elementos reconocidos, categorizados, sino en forma sensorial, burda [...] 
Merece la pena que subrayemos aquí que los registros sensoriales son precategoriales porque 
un problema central en la investigación relacionada con los registros es la separación de los 
efectos verdaderos del almacenaje sensorial de posibles efectos de información reconocida», 
págs. 39-40. 


104 Karl H. Pribram, Languages of the Brain, Englewood Cliffs, N.J., 1971, pág. 136. 


105 Véase John R. Anderson y Gordon H. Bower, Human Associative Memory, Washington, 
D.C., 1973, pág. 453. 


106 Al comentar sobre el AIS (almacenaje de información sensorial), Lindsay y Normal 
(Human Information Processing, Nueva York, 1972, pág. 329) señalan que esta «discrepan- 
cia entre la cantidad de información retenida en el sistema sensorial y la cantidad que puede 
ser usada por estadios de análisis más tardíos es muy importante. Implica algún tipo de límite 
en la capacidad de estadios más tardíos, un límite que no es compartido por los mismos esta- 
dios sensoriales». 


— 170 — 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


Al comparar las experiencias sensoriales con representaciones pictóri- 
cas (y las estructuras cognitivas con enunciados), no pretendo sugerir que 
nuestra experiencia sensorial siempre (o alguna vez) posea un carácter pic- 
tórico o de imagen, que la percepción de las cosas requiera poseer peque- 
ñas imágenes (sonidos, olores, sabores) en la cabeza o que la actividad 
cognitiva es un fenómeno lingúístico. Puede ser que la adquisición de len- 
guaje sea esencial para un organismo que tenga la capacidad de convertir 
información sensorial en forma digital (y por lo tanto, la capacidad de tener 
creencias y conocimientos), pero esto, si es así, es una cuestión empírica, 
una cuestión a la que volveré en la tercera parte. Por el momento, sólo 
deseo desarrollar la idea de que la diferencia entre nuestra experiencia per- 
ceptiva, la experiencia que constituye nuestra visión y oído de las cosas, y 
el conocimiento (o creencia) que es normalmente una consecuencia de esta 
experiencia, es, fundamentalmente, una diferencia de codificación. A este 
respecto, la relación entre procesos sensoriales y procesos cognitivos es 
como la relación entre la representación analógica preliminar y la repre- 
sentación digital subsecuente descrita en la figura 6-1. El velocímetro lleva 
la información de que el vehículo va entre 25 y 50 millas por hora, y lleva 
esta información en forma analógica (incluida en la información más es- 
pecífica de que el vehículo va a 43 millas por hora), pero el estado concreto 
del sistema que lleva esta información (la posición de la aguja) no es una 
imagen de la velocidad del vehículo. No se asemeja al estado de cosas 
sobre las que transporta información. Y el tercer tono, el que lleva (en 
forma digital) la información de que el vehículo va a una velocidad entre 
25 y 50 millas por hora, no es un enunciado o una representación lingúiís- 
tica de la velocidad del vehículo. La conversión de la información de una 
forma analógica a una forma digital puede suponer una conversión de ima- 
gen a enunciado, pero no lo necesita. Desde un punto de vista neurológico, 
la transformación de la codificación sensorial a la cognitiva se produce en 
la ausencia completa de imágenes o enunciados. 

Sin embargo, a diferencia del convertidor simple y mecánico descrito 
en la figura 6-1, los sistemas vivos son capaces de modificar sus unidades 
de conversión digital. En la medida en que las necesidades, propósitos y 
circunstancias de un organismo cambian, se hace necesario alterar las ca- 
racterísticas del convertidor digital de forma que explotemos más, o dife- 
rentes, informaciones adquiridas en la representación sensorial. No es ne- 
cesario cambio alguno en la forma en que las cosas aparecen, suenan o 
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huelen. Puede que sólo se dé un cambio en cuáles son las informaciones 
(transportada en forma analógica) que se extraen de la representación sen- 
sorial. 

De forma similar, el aprendizaje de un concepto es un proceso en el 
que existe una modificación más o menos permanente de la habilidad de 
un sistema para extraer información codificada analógicamente del alma- 
cén sensorial. Lo que le falta al sistema mecánico simple que acabamos de 
describir es la capacidad de cambiar sus características de respuesta de 
forma de explote más y diferentes informaciones imbuidas en el registro 
del velocímetro. No puede aprender. No hay forma de que modifique la 
manera en que digita- liza la información para responder, por ejemplo, con 
el tono 3 (u otro tono completamente diferente) únicamente cuando el 
vehículo lleva una velocidad entre 30 y 35 millas por hora. Esta informa- 
ción más específica se recoge, se procesa y es suministrada al convertidor 
(por el velocímetro), pero el sistema es incapaz de «atender a» este hecho, 
incapaz de extraer esta pieza de información y «actuar» sobre ella. Con- 
trastémoslo con un niño, un niño cuyos sistemas de recepción son comple- 
tamente maduros y funcionan de forma normal, que aprende a reconocer e 
identificar elementos en su entorno. Aprender a reconocer e identificar 
narcisos, por ejemplo, no es un proceso que requiera la recogida de más 
información de (o sobre) los narcisos. Dada la ávida vista del niño, puede 
que (antes de aprender) haya estado recibiendo más información de los 
narcisos que su profesor, quien goza de más experiencia, pero de una vista 
más corta. Aun así, el profesor sabe que la flor es un narciso y el niño no 
lo sabe. El niño sólo sabe que es una flor de algún tipo determinado (quizá 
ni siquiera sepa todo esto). Lo que el alumno necesita no es más informa- 
ción del tipo de la que se podría adquirir con una lupa. Él no es perceptual- 
mente deficiente. La información requerida (requerida para identificar la 
flor como un narciso) está siendo adquirida. Lo que no posee es la habili- 
dad para extraer esta información, la habilidad de descodificar o interpretar 
los mensajes sensoriales. Lo que el niño necesita no es más información 
sobre el narciso, sino un cambio en la forma en que codifica la información 
que ha estado recibiendo. Hasta que esta información (que las flores son 
narcisos) sea recogida en forma digital, el niño ve los narcisos, pero ni sabe 
ni cree que son narcisos. 

El proceso de digitalización y su relación con el aprendizaje y la acti- 
vidad cognitiva en general, será examinado con más detenimiento en la 
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tercera parte. Por el momento, nuestra preocupación se centra en los siste- 
mas de transmisión perceptual, aquellos sistemas cuya función consiste en 
facilitar, en nuestra experiencia sensorial, la información de la que depen- 
den estas actividades cognitivas. 

Quizá debiera señalar que estoy simplificando considerablemente el 
proceso a través del cual se extrae la información sensorial desde los estí- 
mulos físicos, integrada con información colateral y codificada en forma 
sensorial. Ignoro los detalles de este proceso para iluminar una diferencia 
importante en la forma en que se codifica esta información: en forma sen- 
sorial (analógica) y en forma cognitiva (digital). En particular, ignoro el 
simple hecho de que gran parte de la información integrada en la represen- 
tación sensorial (nuestra experiencia sensorial) es el resultado de una inte- 
gración temporal: 


La evolución ha templado el sistema perceptual humano para registrar, no la 
información de bajo grado de las imágenes momentáneas de la retina, sino más 
bien la información de alta fidelidad de las secuencias de imágenes (cursiva mía) 
o de los complejos de imágenes simultáneos, el tipo de información ofrecido por 
la paralaje motora y la paralaje binocular. !% 


James Gibson ha argúido de forma persuasiva que gran parte de la in- 
formación que conseguimos extraer de nuestro medio ambiente depende 
de una estrategia de detección de invariantes de alto nivel en una serie 
temporal de señales: el tipo de información que somos capaces de recoger 
yendo de una parte a otra y registrando la alteración sistemática en los 





107 T. G. R. Bower, «The Visual World of Infants», en Perception: Mechanisms and Mo- 
dels, San Francisco, 1972, pág. 357. Ulric Neisser también señala que la supresión progresiva 
de microtextura en un filo provoca una percepción compulsoria de una superficie tras la otra 
y que este tipo de información pasa a existir sólo cuando algo se mueve (no existe en la serie 
congelada); «Gibson”s Ecological Optics: Consequences of a Different Stimulus Descrip- 
tion», Journal for the Theory of Social Behaviour, vol. 7. N* 1, abril 1977, pág. 22. 

En un sumario de constancia de movimiento-tamaño Gunnar Johans- son concluye que in- 
cluso en condiciones de estímulo extremadamente empobrecidas, el sistema sensorial es ca- 
paz de extraer suficiente información (para el efecto de constancia) de los patrones en cam- 
bio; pág. 382 en «Spatial Constancy and Motion in Visual Perception», en Stability and Cons- 
tancy in Visual Perception, William Epstein (ed.), Nueva York, 1977. 
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patrones, texturas y posiciones relativas.!% Para comprender cómo se re- 
glstran ciertos tipos de información, es importante comprender la forma en 
que una representación sensorial puede ser el resultado de una adición tem- 
poral de señales. Pensar en el proceso de información sensorial en términos 
estáticos, en términos del tipo de información imbuido en el estímulo en 
un tiempo particular, es pasar por alto completamente hasta qué punto 
nuestras representaciones sensoriales dependen de un proceso integrativo 
en el tiempo. Incluso un simple tacómetro (en tanto que depende de la fre- 
cuencia de pulsaciones) puede ser usado para ilustrar la importancia de 
este fenómeno. 

Estoy ignorando el hecho de que, a menudo, nuestras representaciones 
sensoriales llevan información derivada de varios canales sensoriales di- 
ferentes. Si tenemos en cuenta sólo el estímulo que alcanza los ojos (in- 
cluso si lo entendemos de forma relativa a algún intervalo temporal), la 
conclusión inevitable sería que el estímulo es (por lo menos, muy a me- 
nudo) ambiguo. Sin embargo, sería un error, concluir que la representación 
sensorial de la misma fuente es ambigua. Y ello porque no existe ninguna 
razón para pensar que nuestra experiencia visual de la fuente descansa ex- 
clusivamente en la información que llega en la luz que alcanza nuestros 





108 Véase el libro de Gibson The Senses Considered as Perceptual Systems, Londres, 1966, 
y el anterior The Perception of the Visual World, Boston, 1950. Puede que haya alguna cues- 
tión sobre si la noción de información de Gibson es la misma que aquella con la que estamos 
operando en este trabajo. En una conferencia sobre filosofía y psicología (Universidad de 
Cornell, abril 2-4, 1976), Ulric Neisser afirmó que el concepto de información de Gibson 
podría ser identificado con el de Shannon. David Hamlyn lo negó, y si le entendí correcta- 
mente, también lo negó Gibson. Sin embargo, el pasaje siguiente es revelador: 

«Comencemos señalando que información sobre algo significa sólo especificidad de algo. 
Por tanto, cuando decimos que la información es transmitida por la luz, o por el sonido, el 
olor o la energía mecánica, no queremos decir que la fuente es literalmente transportada como 
una copia o réplica. El sonido de un timbre no es el timbre y el olor del queso no es el queso. 
De forma similar, la proyección en perspectiva de las caras de un objeto (por el flujo rever- 
berante de la luz reflejada en un medio) no es el objeto en sí mismo. Sin embargo, en todos 
estos casos una propiedad del estímulo está unívocamente relacionada con una propiedad del 
objeto por virtud de las leyes físicas. Esto es lo que quiero decir con la transmisión de infor- 
mación del entorno.» (Pág. 187, The Senses Considered as Perceptual Systems.) 

Me parece que esto justifica por completo el juicio de Neisser. Es más, está en razonable 
acuerdo con el concepto de información desarrollado en el capítulo 3 del presente trabajo. 
Véase Ulric Neisser, «Gibson's Ecological Optics: Consequences of a Different Stimulus 
Description», y D. W. Hamlyn, «The Concept of Information in Gibson”s Theory of Percep- 
tion», Journal for the Theory of Social Behavior, vol. 7, n? 1, abril 1977. 
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receptores visuales. Todo lo contrario. La información sobre la orientación 
gravitacional de los objetos es disponible o asequible en la experiencia 
sensorial porque el input visual es procesado junto con la información de 
inclinación corporal de las fuentes propioceptivas. Las señales que especi- 
fican la posición de la cabeza en relación a la gravedad, la posición angular 
y el movimiento de los ojos en relación a la cabeza, y la posición relativa 
y el movimiento de todas las restantes partes del cuerpo que importan, tie- 
nen un papel en la determinación de cómo experimentamos lo que experi- 
mentamos. La riqueza de información disponible en nuestra experiencia 
sensorial debe explicarse, por lo menos en parte, por el hecho de que esta 
experiencia incluye información recogida a lo largo del tiempo desde di- 
versas fuentes. 

Los detalles, aunque son importantes para comprender los procesos 
reales a través de los cuales se produce nuestra experiencia sensorial y los 
tipos de mecanismos responsables de la información que allí se encuen- 
tra,' no son directamente pertinentes para nuestra caracterización del re- 
sultado —la experiencia sensorial en sí misma— y la forma en que codi- 
fica la información. Más adelante, en este capítulo, será necesario analizar 
con mayor detenimiento el mecanismo transmisor de información para cla- 
rificar la naturaleza del objeto perceptivo y, en concreto, la forma en que 
los mecanismos de constancia ayudan a determinar qué es lo que vemos, 
oímos u olemos. Pero para los propósitos presentes, podemos dejar de lado 
estos detalles. Nuestra preocupación inmediata es el carácter analógico de 
nuestra experiencia sensorial. 

Considérese la visión. Miramos una escena bastante compleja: una 
multitud de jóvenes jugando, una librería llena de libros, una bandera 
donde se ven todas las estrellas y barras. Un resultado típico en tales situa- 
ciones, especialmente cuando son breves, es que se ha visto más de lo que 





10% Los mecanismos sensoriales subyacentes pueden incluso incluir lo que a algunos inves- 
tigadores (siguiendo a Helmoltz) les gusta describir como procesos computacionales o infe- 
renciales. Aunque no creo que haya nada de malo en usar esta terminología para describir 
procesos sensoriales, pienso que esto puede conducir a conclusiones erróneas al asignar es- 
tructura cognitiva a tales procesos. Podemos describir fenómenos sensoriales en términos 
informacionales, en términos que implican (por lo menos hasta este punto) una estructura que 
tiene contenido proposicional, pero una estructura con contenido proposicional no debiera 
confundirse con poseer el tipo de contenido que asociamos con conocimiento, creencia y 
juicio. Volveré a este punto en el capítulo 7. 
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advertimos (o quizá podríamos haber advertido) conscientemente o de 
aquellos a lo que habíamos prestado atención. Resulta que había 27 niños 
en el patio de juego, y aunque, quizá, los vimos a todos, no somos cons- 
cientes de cuántos vimos. A menos que hubiésemos dispuesto de tiempo 
para contar, no creemos haber visto 27 niños (aunque ciertamente pode- 
mos creer algo menos específico, por ejemplo, que vimos muchos niños o 
que vimos más de una docena de ellos). Vimos 27 niños, pero esta infor- 
mación, información numérica precisa, no se refleja en lo que sabemos o 
creemos. No existe una representación cognitiva de este hecho. Decir que 
vimos todos esos niños (sin habernos dado cuenta) implica que había al- 
guna representación sensorial de cada elemento. La información pasó den- 
tro. Fue codificada perceptivamente. De otra forma, ¿por qué había de ser 
cierto decir que vimos 27 en vez de 26 o 287? Por lo tanto, la información 
que es extraída de forma cognitiva desde las representaciones sensoriales 
(a saber, la información de que hay muchos niños en el patio, o más de una 
docena de niños) es información que la estructura sensorial codifica en 
forma analógica. La relación entre nuestra experiencia de los niños y nues- 
tro conocimiento de los niños es la misma que existe entre el velocímetro 
y el tono en la figura 6-1. 

No intento sugerir que existe una correspondencia psicofísica entre la 
información contenida en los estímulos físicos (o las secuencias tempora- 
les de estímulos) y la información contenida en la experiencia sensorial 
que surge de ese estímulo. Obviamente, existe una pérdida de información 
entre las superficies del receptor y la representación interna. Y, a la in- 
versa, ocurre algo llamado «restauración»: la inserción en la experiencia 
sensorial de rasgos representacionalmente significantes que no tienen con- 
trapartida en los estímulos físicos (cierre de fronteras, restauración de so- 
nidos perdidos, etc.).!*% Si, por ejemplo, alguien vio todos los 27 niños, 
pero vio a algunos de ellos tan sólo de forma periférica (o en la oscuridad), 
parece improbable que se disponga de información sobre el color de sus 
ropas en la experiencia visual. Si la información sobre el color, contenida 
en el estímulo (luz alcanzando la retina) no va a parar alos conos sensitivos 
al color de la fóvea, obviamente, no se dispondrá de ella en la experiencia 





110 R, M. Warren, «Perceptual Restoration of Missing Speech Sounds», Science (1970), 
pág. 167. 
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sensorial resultante.'!! Pero incluso respecto a los niños vistos de forma 
periférica, se codificará de forma perceptiva cierta información sobre su 
(aproximada) localización relativa, tamaño, distancia y número. Podemos 
suponer, como hacen muchos psicólogos, que las operaciones preliminares 
asociadas con los procesos preatentivos (aquellos que ocurren antes de los 
más elaborados procesos perceptivos asociados con la atención focal) sólo 
ofrecen unidades figuracionales segregadas, unidades que no poseen la ri- 
queza de información disponible en aquellas porciones del campo visual a 
las que se presta atención.*'? Aun así, ciertamente existe más información 
contenida en esta configuración de «unidades figuracionales» de la que 
extraemos normalmente (información sobre la localización, tamaño rela- 
tivo y posición de los objetos representados). Típicamente, los sistemas 
sensoriales cargan la capacidad de manejo de información de nuestros me- 
canismos cognitivos de tal forma que no se puede digerir todo lo que se 
nos ofrece en la percepción. Lo que se digiere son bits e información, in- 
formación que la estructura sensorial lleva en forma analógica. 

Hay una regla de siete que nos dice que existe cierta limitación de la 
velocidad a la que los sujetos humanos pueden procesar información.!! 


1 Lo que no significa decir que cosas periféricas parecerán carentes de color. Esto puede 
verse como un caso de restauración perceptual. Sin embargo, lo importante es que esta res- 
tauración no transporta información sobre el color de los objetos vistos, dado que no depende 
del color de los objetos del modo requerido. De forma similar, hay un lunar en la retina (el 
lunar ciego) donde el nervio óptico deja el ojo que es incapaz de extraer información desde 
el estímulo. Sin embargo, si un campo homogéneo (por ejemplo, una hoja de papel blanco) 
es fijada (con un ojo), no vemos un lunar negro. Aunque no se debería suponer que esta 
«interpolación» sensorial transporta información acerca del estímulo. Porque, obviamente, si 
hubiese un lunar negro en este punto del campo, no lo veríamos (en condiciones de visión 
rigurosamente limitadas). Se perdería esta información. 


112 Véase, por ejemplo, Ulric Neisser, Cognitive Psychology, Nueva York, 1967, págs. 94- 
104. Véase también D. O. Hebb, «Summation and Learning in Perception»: «La unidad de 
una figura se define aquí como lo que refiere a esa unidad y segregación desde el trasfondo 
que parece ser un producto directo del patrón de excitación sensorial y de las características 
heredadas del sistema nervioso sobre el que actúa. La unidad y peculiaridad de tales figuras 
desde su trasfondo, son independientes de la experiencia, son “primitivas”, págs. 140-141 en 
Peter A. Fried (ed.), Readings in Perception, Lexington, Mass., 1974. 


113 George A. Miller, «The Magical Number Seven, Plus or Minus Two: Some Limits on 
Our Capacity for Processing Information», The Psychological Review, vol. 63, marzo 1956. 
El número siete es un índice de nuestra capacidad para hacer juicios absolutos precisos de los 
estímulos unidimensionales. Nuestra capacidad de identificar de forma precisa cualquiera de 
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Cuando la información llega a una velocidad que excede esta «capacidad», 
el organismo no la procesa. Ya hemos visto (capítulo 2, en La medida ade- 
cuada de la información) que la idea de «capacidad del canal» no tiene 
una aplicación directa con la cantidad de información que puede ser lle- 
vada por una señal particular. Se aplica tan sólo a la cantidad media de 
información que un conjunto de señales puede llevar. Sin embargo, enten- 
dida correctamente, esta regla parece tener alguna validez empírica apro- 
ximada. Pero su importancia no debería ser malinterpretada. Si la regla se 
aplica de algún modo, debe considerarse válida para nuestra capacidad de 
procesar información cognitivamente. No es válida, y no existe evidencia 
alguna para sugerir que sea válida (sino todo lo contrario), para nuestra 
codificación de información perceptiva. La regla representa algún tipo de 
límite a la cantidad de información que podemos extraer desde nuestra ex- 
periencia sensorial, no un límite a la cantidad de información que puede 
ser contenida en esta experiencia. Asigna un límite a nuestra capacidad de 
convertir información de la forma analógica a la digital. Recordemos el 
sistema del velocímetro y el zambador. Una limitación similar es válida 
para este sistema considerado como un todo. Aunque la entrada (input) 
contiene 6,65 bits de información sobre la velocidad del vehículo, a la sa- 
lida (output) contiene, como mucho, 3,32 bits. La salida media es algo 
menos que esto. Pero este límite de las capacidades de procesar informa- 
ción de este sistema es un límite que surge como resultado del mecanismo 
de conversión de lo analógico a lo digital. 6,65 bits de información com- 
pletos se introducen dentro. Existe una representación interna de la velo- 
cidad del vehículo en todo momento. Sin embargo, esta información se 
utiliza de forma selectiva para obtener, en el output, una representación 
digital de ciertos rasgos importantes del input. Si la regla de siete es válida 
de algún modo, es válida para la relación input-output. No es válida al 
nivel del proceso que ocurre antes de la conversión digital. No es válida 
para la codificación sensorial de la información. 





varios cientos de caras, cualquiera de varios miles de palabras, etcétera, no debería ser tomada 
como una excepción a esta «regla». Y ello porque rostros, palabras y objetos son estímulos 
multidimensionales. 
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J. R. Pierce presenta al mismo argumento al discutir la capacidad de 
procesar información de los sujetos humanos. '!* 


«Ahora bien, la ley de Miller y los experimentos de velocidad de lectura llenen 
implicaciones embarazosas. Si un hombre sólo extrae 27 bits de información de 
una imagen, ¿podemos transmitir a través de 27 bits de información una imagen 
que, si se proyecta en una pantalla, imitará de forma satisfactoria cualquier ima- 
gen? Si un hombre sólo puede transmitir unos 40 bits de información por segundo 
como los experimentos de velocidad de lectura indican, ¿podemos transmitir imá- 
genes de televisión o sonido de calidad satisfactoria usando únicamente 40 bits por 
segundo? Creo que la respuesta a ambas preguntas es negativa. ¿Dónde está el 
error? El error está en que hemos medido lo que sale del ser humano, no lo que 
entra. Quizás un ser humano sólo pueda, en algún sentido, darse cuenta de 40 bits 
de Información por segundo, pero tiene la capacidad de elegir aquello de lo que se 
da cuenta. Podría, por ejemplo, darse cuenta de la chica o podría darse cuenta del 
vestido. Quizá se diese cuenta de algo más, pero se desvanece antes de que pueda 
describirlo.» 


Pierce afirma que medir la cantidad de información que puede pasar a 
través de un sujeto es medir la limitación de la operación conjunta de los 
mecanismos perceptivo y cognitivo (por no mencionar los mecanismos de 
actuación). Cualesquiera que sean los límites a los que lleguemos apli- 
cando esta técnica, no nos dirán nada sobre los límites informativos de 
nuestros mecanismos sensoriales. Como mucho, nos darán la capacidad 
del enlace más débil en la cadena de comunicación, y no existe ninguna 
razón para pensar que la sensación constituye el enlace más débil. Como 
Pierce señala, no podemos imitar una imagen con sólo 27 bits de informa- 
ción incluso si 27 bits de información es aproximadamente lo máximo que 
alguien pueda procesar cognitivamente. Nuestra propia experiencia per- 
ceptual atestigua el hecho de que entra más información que la que somos 
capaces de extraer. 

Se puede ilustrar este mismo punto a un conjunto de experimentos con 
breves despliegues visuales.''5 Los sujetos son expuestos a una serie de 





114 JR. Pierce, Symbols, Signáis and Noise, Nueva York, 1961, págs. 248-249. 


115 G. Sperling, «The Information Available in Brief Visual Presenta- tions», Psychological 
Monographs, vol. 74, n* 11 (1960). También Averbach y Coriell, «Short-Term Memory in 
Vision», Bell System Technical Journal, vol. 40, n? 196, y «Short-Term Storage of Informa- 
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nueve o más letras durante un breve período de tiempo (cincuenta milise- 
gundos). Se descubre que tras apartar el estímulo existe una persistencia 
de la «imagen visual». Los sujetos informan que las letras parecen estar 
visualmente presentes y ser legibles cuando se produce un tono 150 mili- 
segundos fras recoger el estímulo. Neisser ha apodado a esto memoria icó- 
nica: un almacenamiento temporal de información sensorial en forma per- 
ceptiva.!!* Sin embargo, no necesitamos pensar en ello como la persisten- 
cia de una imagen. Lo que persiste es una estructura en la que la informa- 
ción entrante sobre una serie pictórica es codificada en preparación para 
su utilización cognitiva. Pues resulta que aunque los sujetos sólo pueden 
identificar tres o cuatro letras de las expuestas brevemente, cuáles son las 
letras que consiguen identificar depende de la naturaleza de un estímulo 
posterior, un estímulo que aparece sólo 150 milisegundos tras la recogida 
de la serie de letras original. El estímulo posterior (una marca que aparece 
en diferentes posiciones) tiene el efecto de «cambiar la atención del sujeto 
a partes diferentes del icono persistente». El estímulo posterior cambia el 
proceso de conversión de analógico a digital: se extraen diferentes infor- 
maciones desde la representación sensorial permanente. 

Lo que estos experimentos muestran es que aunque existe un límite de 
la velocidad a la que los sujetos pueden procesar información cognitiva- 
mente (identificar o reconocer letras en la serie de estímulos), la misma 
limitación no parece ser válida para los procesos sensoriales a través de los 
que esta información es facilitada a los centros cognitivos. Aunque los su- 
jetos podían identificar tan sólo tres o cuatro letras, en el «icono» persis- 
tente había incorporado información sobre todas las letras (o por lo menos 
algunas más).!'” El sistema sensorial contiene información sobre el carác- 
ter de las nueve letras en la serie, mientras que el sujeto posee información 
sobre cuatro, como mucho. La disponibilidad de esta información es de- 
mostrada por el hecho de que tras eliminar el estímulo el sujeto todavía 





tion in Vision», Information Theory: Proceedings of the Fourth London Symposium, C. Che- 
rry (ed.), Londres, 1961. 


116 Ulric Neisser, Cognitive Psychology, capítulo 2. 


117 «Parece como si toda la información que hay en la proyección de la retina se encontrarse 
en este almacén icónico, dado que el que percibe puede obtener cualquier parte que se le 
pida.» Ralph Normal Haber y Maurice Hershenson, The Psychology of Visual Perception, 
Nueva York, 1973, pág. 169. 
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puede (dependiendo de la naturaleza de la estimulación posterior) extraer 
información sobre cualquiera de las letras de la serie. Por lo tanto, en el 
icono persistente debe existir información sobre todas las letras en la serie. 
El sistema visual está procesando y convirtiendo en disponible una canti- 
dad de información mucho mayor de la que los mecanismos cognitivos del 
sujeto pueden absorber (es decir, convertir en forma digital). Nuestra ex- 
periencia sensorial es informativamente más rica y profusa que nuestra 
utilización cognitiva de ella. En relación con la información, conseguimos 
extraer desde la representación sensorial (cualesquiera que sean las creen- 
cias que produzca el tener este tipo de experiencia sensorial), la represen- 
tación sensorial en sí misma cumple los requisitos de una representación 
analógica de la fuente. Es este hecho el que hace que la representación 
sensorial sea más como una imagen de la fuente, y a la creencia consi- 
guiente la convierte en un enunciado sobre esta última. !'$ 

Finalmente, consideremos un ejemplo proveniente de estudios del 
desarrollo. Eleanor Gibson, al relatar los estudios de Kliiver con monos, 
describe un caso en el que los animales fueron entrenados responder al 
mayor de dos rectángulos.*!? Cuando se alteró la forma de los rectángulos, 
los monos continuaron respondiendo al mayor de éstos, cualquiera que 
fuese su tamaño absoluto. En palabras de Kliiver: 


«Si un mono reacciona frente a estímulos que pueden ser caracterizados como 
pertenecientes a gran número de dimensiones diferentes, y si al hacerlo así reac- 
ciona de forma consistente en términos de una relación, por ejemplo en términos 
de la relación “más grande que”, podemos decir que “abstrae”.» 





118 Irvin Rock interpreta que estos experimentos nos sugieren que «en algún sentido del 
término percepción, todos los elementos de la serie son percibidos. Algunas representaciones 
sensoriales de cada elemento permanecen durante una fracción de segundo. La percepción 
durante este breve período está basada en la persistencia en el sistema visual de la descarga 
neural ocasionada por la imagen de las palabras en la retina incluso después de haberse reti- 
rado el despliegue de las letras. Sin embargo, a menos que los elementos sean procesados 
ulteriormente, estas representaciones sensoriales se desvanecerán rápidamente.» An Intro- 
duction to Perception, Nueva York, 1975, pág. 359. Sobre el sentido del término «percep- 
ción» según el cual todos los elementos son percibidos, ver más adelante bajo el rótulo: Los 
Objetos de la Percepción. 


119 Principies of Perceptual Learning and Development, Nueva York, 1969, pág. 284. 
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Los monos de Kliiver tuvieron éxito en la abstracción en la relación 
«más grande que». Pero ¿cómo debemos describir la situación perceptiva 
antes de que los monos aprendiesen a abstraer esta relación? Los rectán- 
gulos, ¿les parecían diferentes a los monos? Si no, ¿cómo podrían aprender 
a distinguir entre ellos? ¿Qué posible esquema de refuerzo podría llevarles 
a reaccionar de forma diferente ante elementos perceptualmente indistin- 
guibles? Parece que lo más natural sería decir de una situación de este tipo 
(a cual es típica de situaciones de aprendizaje en general) que antes del 
aprendizaje, antes de la abstracción con éxito de la relación adecuada, la 
experiencia perceptiva de los monos contenía la información que sólo más 
tarde consiguieron extraer. Es posible, supongo, que los rectángulos sólo 
comenzasen a parecer diferentes a los monos tras exposiciones repetidas, 
que el esquema de refuerzo originase en realidad un cambio perceptivo (al 
igual que cognitivo).!? Esto sería entonces un caso señalado de aprendi- 
zaje perceptivo (cambio en el percepto o representación sensorial como 
resultado de entrenamiento).'?! Puede que se dé aprendizaje perceptivo, 
especialmente con los más jóvenes y los que ven desde hace poco, y en 
sujetos maduros con figuras ambiguas, !?? pero no hay ninguna razón para 
suponer que está ocurriendo en cada situación con sujetos maduros. Lo 
que está ocurriendo aquí es muy parecido a lo que ocurre con el niño que 
está aprendiendo a reconocer los narcisos. Las flores no parecen diferen- 
tes; simplemente, el sujeto aprende cómo organizar (recodificar) la infor- 
mación disponible en su experiencia sensorial. 

Esta situación todavía se aclara más si presentamos a los monos tres 
rectángulos y tratamos de que abstraigan la relación de «tamaño interme- 
dio». Es posible que los chimpancés resuelvan este problema más difícil, 





120 Pero, ¿cómo explicar entonces las diferentes respuestas? «Si la experiencia ha de tener 
un efecto, tiene que existir primero una percepción del patrón que no sea él mismo una fun- 
ción de la experiencia, y a través de esta percepción las señales pertinentes de la memoria 
pueden ser activadas sobre la base de la similitud.» Irvin Rock, óp. cit., pág. 361. 


121 William Epstein, Varieties of Perceptual Learning, Nueva York, 1967. 


122 Véase, por ejemplo, George J. Steinfeld, «Concepts of Set and Availability and Their 
Relation to the Reorganization of Ambiguous Pictorial Stimuli», Psychological Review, vol. 
74, n* 6 (1967), págs. 505-522. También Irvin Rock: «Pero existe un cambio perceptual ge- 
nuino cuando al ver una figura potencialmente familiar se pasa de un organización inicial 
«sin sentido» a un organización subsiguiente «con sentido». La figura parece diferente 
cuando se la reconoce.» Óp. cit., pág. 348. 
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pero para los monos es extremadamente dificultoso.'? Supongamos que 
no son capaces de este tipo de aprendizaje más complejo. ¿Qué deberíamos 
decir acerca de la situación perceptival con respecto a los monos? Dado 
que ya han abstraído la relación «mayor que», podría asumirse que están 
recibiendo y codificando perceptivamente la información de que el rectán- 
gulo A es mayor que el B, y que B es mayor que C. En términos más co- 
munes esto es una forma de decir que el rectángulo intermedio (B) parece 
más pequeño que el mayor (A) y mayor que el más pequeño (C). Pero la 
información sobre qué rectángulo es intermedio, aunque está obviamente 
incluida (en forma analógica) en la misma experiencia de percepción, no 
es extraída cognitivamente (y aparentemente no puede serlo) por el animal. 
Decir que el mono no puede abstraer la relación «tamaño intermedio», por 
tanto, no es decir nada sobre la forma en que codifica perceptualmente la 
información sobre las figuras. Más bien es decir algo sobre sus limitacio- 
nes cognitivas. La información es disponible en forma analógica en la ex- 
periencia que el animal está teniendo de los tres rectángulos, pero el animal 
es incapaz de generar una respuesta de entrada-salida apropiada, el tipo de 
respuesta característico del reconocimiento o la identificación, para este 
tipo de información. No sabe (piensa, cree, juzga) que B es de tamaño in- 
termedio, incluso si esa información está disponible en su representación 
sensorial de A, B, y C.'?* 

Aunque nuestro sistema de velocímetro-tono no puede aprender, sus 
limitaciones pueden ser comparadas de forma útil con las del mono. Este 
simple sistema mecánico puede recibir, procesar y generar una represen- 
tación interna (analógica) del hecho de que el vehículo va a una velocidad 
entre 30 y 35 millas por hora. Que el velocímetro marque (por ejemplo) 
32 millas por hora es una codificación analógica de esta información. Sin 





123 Eleanor Gibson, óp. cit., pág. 292. 


124 En su excelente texto introductorio, Irvin Rock, óp. cif., se preocupa continuamente de 
distinguir las cuestiones de percepción de las cognitivas. Veamos un ejemplo: «Aprender una 
discriminación conlleva algo más que mera percepción; también están implicados factores 
cognitivos. Un animal puede distinguir perceptualmente un triángulo y un círculo desde el 
principio, pero, sin embargo, se requiere entrenamiento para saber que a la respuesta a un 
estímulo le sigue una recompensa mientras que a la respuesta a otro estímulo no. Un sujeto 
humano puede necesitar varios intentos antes de darse cuenta de que un triángulo siempre es 
recompensado y un círculo no. Pero nadie concluiría de este hecho que en los primeros in- 
tentos el sujeto no percibía las formas verídicamente (subrayado nuestro)», pág. 369. 
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embargo, tal como es concebido originalmente, el sistema como un todo 
no puede ser construido para «responder» a esta información. Obtenemos 
el mismo tono tanto si el vehículo va a una velocidad entre 30 y 35 millas 
por hora, más despacio (hasta 25 millas por hora), o más deprisa (hasta 49 
millas por hora). El problema radica en la limitación interna del sistema 
para convertir información de forma analógica a forma digital. Puede «re- 
conocer» una velocidad entre 25 y 50 millas por hora porque este hecho, 
el hecho de que la velocidad está dentro de este intervalo, es información 
que el sistema fue designado para convertir en forma digital (un tono dis- 
tintivo).!?2% Pero el sistema es incapaz de «reconocer» detalles más finos, 
incapaz de discriminar de forma más sutil. No posee el concepto de algo 
existente entre 30 y 35 millas por hora, no posee creencias con este conte- 
nido, no dispone de una estructura interna que contenga este tipo de signi- 
ficado. 

Para resumir, nuestra experiencia de percepción (a lo que ordinaria- 
mente nos referimos cuando hablamos de cómo nos parecen las cosas, de 
sus sonidos o de las sensaciones que provocan en nosotros) está siendo 
identificado con una estructura portadora de información, una estructura 
en la que la información sobre la fuente se codifica en forma analógica y 
se hace disponible a algo similar a un convertidor digital (más sobre esto 
en la tercera parte) para su utilización cognitiva. Se dice que esta estructura 
o representación sensorial es una codificación analógica de información 
entrante porque siempre es información incluida en esta estructura senso- 
rial (incluida dentro de una matriz de información más rica) que está sujeta 
a los procesos de digitalización característicos de los mecanismos cogniti- 
vos. Hasta que la información haya sido extraída desde esta estructura sen- 
sorial (digitalización), no ha ocurrido nada parecido al reconocimiento, 
clasificación, identificación, o juicio; esto es, nada de importancia concep- 
tual o cognitiva. 





125 He puesto la palabra «reconocimiento» entre comillas porque éste no es un logro genui- 
namente cognitivo. No se produce ninguna creencia por este sistema mecánico simple, nada 
que posea la estructura intencional del conocimiento. Más sobre cuáles son los rasgos distin- 
tivos de un estado de creencia en la tercera parte. 
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Si se entiende la percepción como la experiencia de sus alrededores 
que una criatura posee, la percepción en sí misma es cognitivamente neu- 
tra.!?26 Sin embargo, aunque uno pueda ver (oír, etc.) un s que es F (infor- 
mación codificada sensorialmente sobre s y, en concreto, la información 
de que s es FF) sin creer o saber que es F (incluso sin tener los conceptos 
necesarios para tales creencias), la misma percepción depende de que 
exista un mecanismo cognitivo capaz de utilizar toda la información con- 
tenida en la representación sensorial. En este sentido, un sistema que no 
puede saber, tampoco puede ver; pero si el sistema es capaz de saber, si 
dispone de los mecanismos de cognición necesarios para ello, entonces 
puede ver sin saber.!?” Una estructura sensorial que transporta la informa- 
ción de que s es F no ha de confundirse con una creencia acerca de s, una 
creencia al efecto de que ses F, sino que, para calificarse de representación 
sensorial de s (una experiencia de s), esta estructura ha de tener una fun- 
ción determinada dentro de la empresa más ardua de procesar información. 
Ha de hacer esta información disponible a un convertidor apropiado para 
su posible utilización cognitiva. 





126 La palabra «percepción» se reserva a menudo para aquellas transacciones sensoriales en 
las que existe algún logro cognitivo (identificación, reconocimiento, etc.). El sentido del tér- 
mino al que aludo aquí es aquel según el cual podemos ver, oír y oler objetos o eventos (ser 
conscientes de ellos) sin categorizarlos necesariamente de alguna forma. Este punto es dis- 
cutido con mayor detenimiento más adelante (nota 29 y la sección siguiente de este capítulo). 


127 En Seeing and Knowing (Chicago, 1969) mantuve que ver s (un perro, un árbol, una 
persona) es esencialmente un acto no-epistémico: ninguna creencia es esencial a la visión. 
Aunque los adultos típicamente adquirimos un variado conjunto de creencias sobre las cosas 
que vemos, ver un perro, un árbol o una persona es en sí mismo una relación que es indepen- 
diente de tales creencias: uno puede ver s sin creer que es F (para cualquier valor de FF). La 
forma en que expreso este punto ahora es diferente, pero la idea es la misma. La única modi- 
ficación consiste en el requisito de que para ser calificada de estado perceptual (ver s) una 
estructura tiene que estar unida a un mecanismo cognitivo capaz de explotar la información 
retenida en la representación sensorial. Mi postura actual a este respecto es de alguna forma 
cercana a la de Frank Sibley en su «Analyzing Seeing», en Perception (Londres, Methuen, 
1971), editado por F. Sibley. Estoy en deuda con David Ring por valiosas discusiones y cla- 
rificaciones sobre este punto. 
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Los objetos de la percepción 


Se ha argumentado que la percepción es un proceso (o, si se quiere, el 
resultado de un proceso) en el que la información sensorial es codificada 
en forma analógica en preparación para su utilización cognitiva. La moda- 
lidad sensorial (ver, oír, etc.) no está determinada por cuál es la informa- 
ción que se codifica, sino por la forma concreta en que se codifica. Puedo 
ver que son las doce de la noche (mirando el reloj), pero también puedo 
obtener esa información a través de medios auditivos (oyendo las campa- 
nadas de medianoche). Lo que convierte a una cosa en un caso de ver y a 
otra en uno de oír no es la información transportada por las dos represen- 
taciones sensoriales (en este caso la información es la misma), sino las 
diferencias en el vehículo a través del cual se transmite esta información, 
una diferencia en las representaciones (en contraste con lo que es repre- 
sentado). 

Además, he argiido que pasar de un estado perceptivo a un estado cog- 
nitivo, de ver a Herman a reconocer a Herman, de oír las campanadas de 
medianoche a saber que es medianoche, de oler o saborear un vino de 
Mosela a identificarlo como un vino de Mosela (por el sabor o el aroma) 
es un proceso que supone la transformación en la forma en que se codifica 
tal información, la transformación de lo analógico a lo digital. Los estados 
cognitivos siempre poseen un contenido proposicional específico, de 
forma explícita o implícita. Sabemos (o creemos, juzgamos o pensamos) 
que ses F (identificamos, clasificamos o categorizamos s como FF). Posee- 
mos gran variedad de formas para describir nuestros estados cognitivos. 
Herman se da cuenta de que el vino se ha estropeado, ve que necesita una 
nueva cinta para la máquina de escribir y puede oír que se ha producido 
un cambio de llave. Frecuentemente, el contenido proposicional no se 
muestra explícitamente en la expresión nominal que sigue al verbo. Pode- 
mos decir, por ejemplo, que Herman detecta una diferencia entre dos es- 
tados, reconoce a su tío o identifica el objeto. En todos estos casos, el con- 
tenido proposicional se deja sin especificar, pero siempre ha de existir al- 
gún contenido específico si las actitudes en cuestión han de calificarse 
como cognitivas. Si Herman detecta una diferencia entre dos sabores, si 
puede distinguir entre ellos, entonces debe saber que los dos sabores difie- 
ren en algún respecto. Quizá, sólo sabe que son diferentes. Si reconoce a 
su tío, debe saber que el señor es esto y lo otro para algún valor de «esto y 
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lo otro» (su tío, el hombre que le lleva caramelos, el extraño que besa a su 
madre). Y si identifica el objeto, debe identificarlo como algo, lo considera 
(y por lo tanto, cree que es) de esta forma para algún valor de «esto y lo 
otro». 

Nuestros estados de percepción son diferentes. Percibimos (vemos, oí- 
mos, olemos, saboreamos y sentimos) objetos y eventos. Vemos al hom- 
bre, olemos la tostada que se está quemando, saboteamos el vino, sentimos 
el tacto de la tela y oímos la caída del árbol. Lo que determina lo que per- 
cibimos (qué objeto o evento) no es lo que creemos (si creemos algo) sobre 
lo que percibimos. Porque, como hemos argumentado, alguien puede ver 
(por ejemplo) un pentágono y pensar que es un cuadrado, probar un bor- 
goña y lomarlo por un chianti, y oír un timbre y creer que está sufriendo 
alucinaciones. O alguien puede no tener ninguna creencia relevante en lo 
más mínimo acerca del objeto percibido. Entonces, ¿qué es lo que deter- 
mina el objeto perceptivo? ¿Qué es lo que hace que yo vea a Herman 
cuando lo confundo por mi tío Emil o cuando lo veo en circunstancias en 
las que no soy capaz de reconocerle?!?8 

Supongamos que estamos sentados en un tren y alguien nos dice que 
se está moviendo. Podemos percibir que se mueve, ver que se mueve u oír 
que se mueve. Aprendemos que se está moviendo cuando nos dicen que lo 
está haciendo. La información de que el tren se está moviendo se ha ad- 
quirido de forma auditiva. Pero, no decimos que podíamos oír que el tren 
se estaba moviendo. El tren, o el movimiento del tren, no es el objeto de 
nuestro estado de percepción. Podemos decir que oímos que el tren se es- 
taba moviendo, indicando a través de esta selección de palabras que la in- 
formación fue recibida por medios auditivos, pero lo que oímos realmente 
fue a nuestro amigo diciendo, «El tren se está moviendo», o palabras a este 
respecto. El que el tren se esté moviendo es el objeto proposicional de 
nuestro estado cognitivo, pero el movimiento del tren no es el objeto de 
nuestro estado perceptivo. 

Todas las modalidades sensoriales tienen un patrón similar. Cuando 
leemos sobre un accidente en los periódicos, podemos llegar a saber que 
ha sucedido un evento concreto. La información es recibida a través de 





128 Las circunstancias que tengo en mente son circunstancias en las que uno ve a Herman 
entre una multitud de gente, pero buscando frenéticamente al niño que hemos perdido, no 
somos capaces de reconocer a Herman o de prestarle ninguna atención particular. 
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medios visuales, lo que normalmente expresamos con el verbo «ver»: vi- 
mos (en el periódico) que había ocurrido un trágico accidente. Pero no 
vimos el accidente. Si nos dicen que K aprendió que s era F viendo, 
oyendo, oliendo o saboreando, no nos están diciendo lo que K vio, oyó, 
olió o saboreó. 

Entonces, ¿qué es lo que determina qué es lo que vemos, oímos, sabo- 
reamos, olemos o sentimos? ¿Qué es lo que determina el objeto perceptivo, 
aquel objeto del que nuestra experiencia sensorial es una experiencia? 

Existe una respuesta familiar, aunque no muy adecuada, a esta cues- 
tión. La teoría causal de la percepción nos dice que vemos y oímos aque- 
llos objetos (o eventos) que son causalmente responsables para nuestra ex- 
periencia perceptiva. Vemos al hombre (no al libro que está sujetando a 
sus espaldas) porque el hombre (no el libro) está directamente implicado 
en una secuencia causal de eventos (incluyendo la reflexión de rayos de 
luz) que genera en nosotros una experiencia visual del tipo adecuado. Dado 
que el libro no está incluido en esta secuencia causal, no lo vemos. Y si 
confundimos a Herman por el tío Emil, lo que hace que veamos a Herman 
(y no al tío Emil) es el hecho de que Herman es causalmente responsable 
de nuestra experiencia sensorial. !?? 

Las dificultades de este análisis son bien conocidas. ¿Cómo ha de estar 
X «incluido causalmente» en la secuencia de eventos que culmina en la 
experiencia sensorial para poder ser calificado como el objeto de esa ex- 
periencia? Supongamos que Herman oye el timbre de la puerta y se dirige 
a ella para ver quién es. Por mor del ejemplo podemos suponer que Her- 
man sabe (o por lo menos cree) que hay alguien en la puerta. Tenemos la 
siguiente secuencia de eventos: 1) alguien llama al timbre, con lo que cie- 
rra un circuito eléctrico; 2) la corriente fluye a través de los electroimanes 
del timbre; 3) un badajo es empujado contra una campanilla (rompiendo a 
la vez el circuito eléctrico); 4) la vibración resultante del badajo contra la 
campanilla origina una onda acústica que golpea los tambores de los oídos 
de Herman; 5) el patrón de presión en los tambores de los oídos de Herman 
causa una serie de pulsaciones eléctricas que se transmiten al cerebro de 
Herman; y, finalmente, 6) Herman sufre una experiencia a la que ordina- 
riamente describimos diciendo que oye sonar el timbre. 





129 Para una cuidada exposición de esta teoría, véase H. P. Grice, «The Causal Theory of 
Perception», Aristotelian Society Proceedings, Sapplementary Volume 35 (1961). 
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Decimos que oye el timbre, u oye sonar el timbre. ¿Por qué no oye que 
el botón está siendo apretado? ¿Por qué no oye a la membrana vibrando en 
su oído? Cada uno de estos eventos está causalmente implicado en el pro- 
ceso que resulta en la experiencia auditiva de Herman, y cada uno de estos 
eventos es lo que H. H. Price llama una condición diferencial.'%% ¿Qué hay 
de especial en el timbre para que lo designemos como lo que se oye? Es 
verdad que si el timbre no hubiese sonado, Herman no habría tenido la 
experiencia auditiva que tuvo, pero tampoco la hubiese tenido si no se hu- 
biera apretado un botón (si la membrana en su oído no hubiese vibrado). 
No lo arreglaremos con decir que en tales situaciones la presión sobre el 
botón es audible. Sin ninguna duda esto es verdadero si confiamos en 
nuestras intuiciones ordinarias acerca de lo que puede ser oído. Pero la 
cuestión que se nos plantea ahora es cómo podemos explicar la audibilidad 
e inaudibilidad de esos eventos en base a razones puramente causales. 


Fuente Evento próximo Receptor 





des F 


FIG. 6.2 


Pienso que un análisis causal no puede ofrecer una explicación satis- 
factoria de los objetos de nuestra experiencia sensorial. No provee ningún 
medio para discriminar entre la variedad de candidatos elegibles. Sugiero 
que lo que falta es una apreciación de la forma en que las relaciones infor- 





150 H, H. Price, Perception, Londres, 1932, pág. 70. 
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mativas actúan para determinar qué es lo que percibimos. Existen dos he- 
chos cruciales acerca de la diferencia entre una relación causal y una in- 
formativa que son fundamentales para una adecuada comprensión de este 
asunto. El primero es que (como vimos en el capítulo 1) C puede causar £ 
sin que E lleve ninguna información importante sobre C. Segundo, E 
puede llevar información sobre algunos de sus antecedentes causales gra- 
cias a que lleva información sobre otros. Estos hechos, tomados en con- 
junto, seleccionan algunos antecedentes causales como únicos, y son estos 
objetos (y eventos), propongo, los que constituyen los objetos de nuestros 
estados perceptivos. 

Consideremos, en primer lugar, y de forma muy esquemática, algunos 
rasgos relevantes de ciertos (pero no todos) sistemas de información-trans- 
misión. Consideremos la situación representada diagramáticamente en la 
figura 6-2. Un cierto estado de cosas existe en la fuente, los c son B, y esto 
causa que d sea E. A su vez, este segundo evento produce el estado (es- 
tructura, señal) que he llamado S. La línea continua indica la ruta de la 
cadena causal. Sin embargo, algunas veces, el que los c sean B origina que 
d sea F en vez de E. Esta ruta alternativa no tiene efecto en S; el mismo 
estado de cosas es producido en el receptor tanto si d es E como si es F. 
La línea discontinua indica una secuencia causal alternativa, una secuencia 
que es la que realmente ocurre de forma ocasional (digamos que un 40% 
de las veces). 

Lo que es interesante de este diagrama (para nuestros propósitos) es 
que ilustra un patrón de transmisión de información en el que una situación 
(S) lleva información sobre un antecedente causal distante (el que los c son 
B) sin levar información sobre los miembros más próximos de la cadena 
causal (o sea, que los d son E) a través de los que se comunica esta infor- 
mación (sobre c). Es como si S se saltase (o «viese a través») de los enlaces 
intermedios en la cadena causal para representar (llevar información so- 
bre) sus antecedentes causales más distantes. Esto es así porque los rasgos 
de S que llevan la información de que c es B (de lo que uno podría aprender 
que algo era B) no llevan la información de que d es E (uno no podría 
aprender de ellos que d es £). Dado que d es E tan sólo el 60% de las veces 
que $ ocurre (llevando la información de que algo es B), $ «dice» que c es 
B sin «decir» que d es E. 

En tales situaciones, el estado de cosas designado como S lleva infor- 
mación sobre la propiedad B (la información de que algo —de hecho c— 
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es B) sin llevar información sobre la propiedad (£) cuya instanciación (por 
d) es el intermediario causal a través del cual se transmite la información 
sobre c. 

Este es el primer punto de contraste importante entre una relación cau- 
sal y una relación informativa. Si nos limitamos a un análisis causal, no 
existe una forma no-arbitraria de seleccionar uno de los antecedentes cau- 
sales de S como más especial que los demás. Todos están igualmente re- 
lacionados en la producción del estado final (S). Algunos de estos antece- 
dentes causales son más remotos que los demás, pero esto es obviamente 
una cuestión de grado. ¿Por qué deberían algunos de estos (más remotos) 
antecedentes ser seleccionados como el objeto de nuestros estados senso- 
riales con la exclusión de los demás? Desde el punto de vista de la teoría 
de la información podemos comenzar a ver por qué debiera ser así. Puede 
que no haya ninguna diferencia entre la forma en que los eventos que ocu- 
rren en nuestra cabeza dependen, causalmente, de una serie de diferentes 
eventos antecedentes, pero puede que exista una diferencia significativa 
en la información que esos estados señoriales llevan sobre los antecedentes 
causales. 

Sin embargo, hay un segundo hecho acerca de la transmisión (le la in- 
formación que es pertinente para la comprensión de la naturaleza del ob- 
jeto de la percepción. Recordemos nuestro ejemplo del timbre de la puerta. 
Se dijo que la experiencia auditiva del oyente llevaba información sobre 
el timbre, información al efecto de que estaba sonando. Pero dado que el 
timbre lleva información al efecto de que el botón del timbre está siendo 
apretado (ésta es la razón por la que podemos saber que alguien está en la 
puerta cuando suena el timbre), la experiencia auditiva también lleva la 
información de que se está apretando el timbre. Se debería señalar que ésta 
es una información específica sobre un antecedente causal. Y aun así, 
como hemos visto, el que se pulse el timbre no es el objeto de nuestro 
estado sensorial. No oímos que se pulsa el botón. Oímos que el timbre 
suena (y con ello averiguamos que el timbre se ha dejado de apretar, oímos 
que alguien está en la puerta). ¿Cuál es la base, en teoría de la información, 
para esta distinción? ¿Por qué uno y no el otro es el objeto si la experiencia 
auditiva (por definición) lleva información específica sobre ambos? 

Puede que la situación se aclare de alguna forma si mejoramos la figura 
6-2 como en la figura 6-3. 
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De nuevo, S no lleva la información de que d es E (aunque ésta es una 
causa próxima de S). Sin embargo, lleva la información de que c (el tim- 
bre) es B (está sonando) y la información de que f (el botón del timbre) es 
G (está siendo apretado). ¿Por qué es c (el timbre) y no f (el botón) el 
objeto perceptivo? 

La distinción entre c y f es simplemente que S ofrece lo que llamaré 
representación primaria de las propiedades de c, pero no de las propieda- 
des de f. S lleva información acerca de c (que es B) y acerca de f (que es 
G), pero representa las propiedades de f gracias a que representa las pro- 
piedades de c. Esto es, la representación S de que los fson G depende del 
enlace informacional entre f y c, mientras que su representación de las pro- 
piedades de c no depende de este enlace. 

S da representación primaria a la propiedad B (en relación a la propie- 
dad G) = La representación de S de algo que es G depende de la relación 
informativa entre B y G, pero no viceversa. 





FIG. 6.3 


Nuestra experiencia auditiva representa el timbre sonando y representa 
el botón que está siendo apretado. Pero sólo se le da una representación 
primaria al primero porque la información que la experiencia lleva acerca 
de apretar el botón depende del enlace informacional entre el botón y el 
timbre, mientras que su representación del timbre que suena no depende 
de esta relación. Si establecemos un corto circuito entre los alambres (con 
lo que causamos que el timbre suene periódicamente cuando no hay nadie 
en la puerta), se rompe el enlace informativo entre el timbre y el botón. 
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Cuando el enlace se rompe, la experiencia auditiva continúa representando 
(Meva información sobre el timbre que está sonando, pero ya no lleva in- 
formación acerca de que se aprieta el botón. 

Si, contrariamente a nuestra hipótesis, la experiencia auditiva conti- 
nuase representando que el botón está siendo apretado (continuase lle- 
vando la información de que se está apretando el botón) incluso cuando se 
rompiese su enlace informacional con el timbre que suena, entonces po- 
dríamos decir que el botón que se aprieta recibe representación primaria 
como tal (en relación con el timbre, por lo menos) en la experiencia audi- 
tiva del sujeto. Su representación ya no dependería de su conexión con el 
timbre que suena. Pero precisamente en esta situación hablaríamos de 
nuestra habilidad para oír que se aprieta el botón (y también, quizás, el 
timbre sonando). Si el botón estuviese muy oxidado, por ejemplo, y 
chrriase fuertemente cuando se le apretase, podríamos ser capaces de oír 
que se le presiona tanto si estuviese conectado con el timbre como si no lo 
estuviese. La explicación de este hecho es que, en estas circunstancias al- 
teradas, ya no se le da al botón que se aprieta una representación secunda- 
ria en términos del timbre que suena. 

Las señales que llegan a través de un sistema de comunicación siempre 
tienen sus propias cualidades: las magnitudes a las que otorga representa- 
ción primaria. Voltímetros, manómetros y velocímetros poseen sus cuali- 
dades propias. Lo que quiero decir es que, cualquiera que sea la informa- 
ción que transmitan, dada la naturaleza de los instrumentos, siempre se da 
representación primaria a determinadas propiedades o magnitudes. El vol- 
tímetro nos puede informar sobre la diferencia de voltaje entre los puntos 
A y B (en un circuito externo), pero lo hace registrando el paso de la co- 
rriente (a través del mismo instrumento) que tales voltajes externos gene- 
ran (cuando el instrumento está conectado de forma correcta). El paso de 
la corriente eléctrica constituye la magnitud propia del instrumento. Un 
altímetro nos dice a qué altitud nos encontramos, pero esta información 
sobre la altitud es transmitida en términos de presión. La presión es la can- 
tidad propia del instrumento. Y (algunos) tacómetros nos pueden decir la 
velocidad que lleva nuestro motor, pero lo hacen representando la frecuen- 
cia con que se dispara una bobina. El instrumento es sensible a la frecuen- 
cia de estos pulsos, y es capaz de transmitir cualquier información que esté 
incluida en tal frecuencia, que es su magnitud propia. Si se ha de traspasar, 
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comunicar o llevar información por medio de tales instrumentos, la infor- 
mación ha de ser primero transformada en la magnitud apropiada de tal 
forma que el instrumento pueda procesarla. Los voltímetros se usan para 
llevar información sobre muchas cosas aparte de las diferencias de voltaje 
(temperatura, peso, resistencia, profundidad, etc., de hecho, cualquier cosa 
que pueda ser convertida en electricidad por un transductor propio), pero 
tan sólo lo puede hacer cuando la información es primero traducida al len- 
guaje del instrumento, sólo cuando se traduce a la dimensión propia. 

Nuestros sistemas sensoriales son similares. Poseen sus objetos pro- 
pios, las cualidades y cantidades a las que les dan representación primaria. 
Si la información sobre la temperatura se ha de codificar visualmente, si 
se nos ha de permitir ver que la temperatura ha subido, la información ha 
de ser transformada o codificada de una forma apropiada para la recepción 
y el procesamiento visuales. Por supuesto, los termómetros efectúan una 
transformación de este tipo. Si la información de que es la hora de la co- 
mida ha de ser representada de forma auditiva, ha de dársele un cuerpo 
acústico. Esto es precisamente lo que hace el timbre (tono, campanada, 
zumbido o lo que sea). El papel de tornasol es una forma de codificar in- 
formación sobre la acidez en una forma visualmente procesable, y el len- 
guaje es nuestro principal instrumento para convertir cualquier informa- 
ción en forma auditiva. 

En tal caso, dando por sentado que nuestra experiencia sensorial sí 
lleva información sobre nuestros alrededores (asumiendo, esto es, que po- 
demos aprender algo sobre nuestro entorno a través de estas experiencias), 
el objeto de la experiencia en cuestión (qué es lo que vemos, oímos, ole- 
mos o gustamos) es aquel objeto (o conjunto de objetos) cuyas propiedades 
son representadas por la experiencia de forma primaria. Una experiencia 
no necesita llevar información sobre todas las propiedades del objeto per- 
ceptivo (y obviamente no lo hace). Sin embargo, de todas las propiedades 
de las que la experiencia lleva información, algunas incluyen las cualida- 
des propias de la modalidad sensorial. El objeto perceptivo es el objeto que 
posee esas cualidades. La razón por la que oímos el timbre, no el botón, es 
la de que, aunque nuestra experiencia auditiva lleva información sobre las 
propiedades tanto del timbre (que está sonando) como del botón (que se 
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está presionando), el sonido (del timbre) es representado en una forma pri- 
maria mientras que el presionar el botón no lo es.!*! 

La distinción entre representaciones primarias y secundarias sirve para 
explicar por qué oímos sonar el timbre y no oímos que se aprieta el botón. 
Pero no sirve para explicar por qué oímos sonar el timbre de la puerta y no 
oímos, por ejemplo, la vibración de las membranas en nuestro oído. ¿No 
se le da representación secundaria al sonido del timbre en relación a la 
conducta de las membranas en nuestro oído? ¿No obtenemos información 
acerca de lo que pasa con el timbre en virtud de (o por medio de) obtener 
información sobre lo que está pasando en nuestros oídos? Si es así, noso- 
tros no oímos el timbre (según esta explicación). Oímos (la vibración de) 
las membranas en nuestro oído o, quizá, que se disparan ciertas neuronas 
en nuestro cerebro. 

Hablando en términos generales, la forma de codificar información 
sensorial de un organismo coloca al objeto de la percepción fuera del or- 
ganismo que percibe. La razón de esto debería ser evidente por la figura 
6-2, y la actuación de los llamados mecanismos de constancia. Nuestra 
experiencia visual, por ejemplo, lleva información altamente específica 
sobre las propiedades de los objetos (su color, forma, tamaño, movi- 
miento) sin llevar el mismo tipo de Información específica sobre los even- 
tos más próximos (en la retina, por ejemplo) de los que la transmisión de 
esa información depende (de forma causal). La constancia del tamaño, 
forma y color atestigua el hecho de que son las propiedades de los objetos, 
y no (por ejemplo) las propiedades del estímulo de la retina (o el encendido 
de las células neuronales) las que son representadas por nuestra experien- 
cia visual en condiciones de visión normales. La experiencia visual que 





151 Si tenemos dos timbres que producen sonidos idénticos, puede parecer que conforme a 
mi explicación del objeto perceptivo, uno no puede oír el timbre que está sonando dado que 
la señal auditiva no lleva información sobre cuál de los timbres está sonando. Esto sería ma- 
linterpretar mi punto de vista. Si Tom y Bill son gemelos (visualmente indistinguibles), esto 
(desde mi postura) no nos impide ver a Tom. Uno no tiene que disponer de la información de 
qué es Tom para ver a Tom. Más bien, la información que uno obtiene debe ser información 
sobre Tom (que lleva una camisa roja, se está rascando la cabeza, etc.). Esto es, las propie- 
dades a las que se da representación primaria deben ser propiedades de Tom. De forma simi- 
lar, en el caso de los timbres, oír el timbre A no es necesariamente obtener información sufi- 
ciente para distinguir el timbre A del B. Todo lo que se necesita es que la información que se 
está recibiendo sea información sobre A (por ejemplo, que está sonando, que tiene un cierto 
tono). 
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constituye nuestra codificación sensorial de la información sobre objetos 
físicos ordinarios puede permanecer inalterada —y de hecho lo hace— 
cuando responde a estímulos próximos bastante diferentes, y tal patrón de 
transmisión de información ejemplifica el patrón que se ha representado 
en un diagrama en la figura 6-2. Nuestra experiencia sensorial no es sen- 
sible a (y, por tanto, no lleva información sobre) el comportamiento de 
nuestros receptores o vías neurales, sino al comportamiento de elementos 
más distantes en la cadena causal. Dado que los antecedentes próximos de 
una experiencia (periféricos, neurales) no son, hablando en términos gene- 
rales, representados en la experiencia en modo alguno, no se les da repre- 
sentación primaria. Por lo tanto, no pueden ser calificados como los obje- 
tos de esa experiencia. 

Por ejemplo, un objeto (un pedazo de papel, digamos) que parece 
blanco a la luz del día continúa pareciendo blanco bajo iluminación drás- 
ticamente reducida aunque la intensidad de la luz que refleja es (casi en la 
oscuridad) menor que la que un objeto negro refleja a la luz del día. Por 
tanto, la experiencia de blancura lleva información sobre la reflexión del 
papel y no sobre la intensidad del estímulo (local) de la retina reflejado 
por el papel. De forma similar, los objetos no parecen cambiar su tamaño 
y forma cuando nosotros (o ellos) se mueven y cambian su orientación 
incluso si la proyección de la retina (y, por lo tanto, el patrón de los encen- 
didos neuronales) está cambiando constantemente. La representación vi- 
sual de un objeto redondo (el que parezca redondo) lleva información so- 
bre la forma del objeto sin llevar información sobre la forma de la imagen 
proyectada en la retina (ésta puede ser redonda o más o menos elíptica). 
Nosotros experimentamos el movimiento de objetos tanto si existe como 
si no un movimiento en la imagen del objeto proyectada en la retina. Los 
objetos estáticos no parecen moverse cuando cambiamos la dirección de 
nuestra mirada (movimiento de la imagen retiniana), pero experimentamos 
movimiento cuando «seguimos» un objeto en movimiento (cuando no 
existe movimiento de la imagen de la retina). Por tanto, experimentar el 
movimiento es recibir información, no sobre lo que está pasando en la re- 
tina (puede o no que se de movimiento aquí), sino sobre lo que está ha- 
ciendo la fuente más distante. 

Woodworth lo expresa con claridad: 


«La imagen de la retina cambia continuamente sin que cambie demasiado la 
apariencia de los objetos. La talla aparente de una persona no cambia cuando se 
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aleja. Un anillo puesto en diferentes ángulos con la línea de visión y, por tanto, 
proyectado como una elipse variable en la retina, continúa apareciendo circular. 
La parte de una pared que está cubierta por la sombra, se ve del mismo color que 
la parte que está bien iluminada. Todavía más radicales son los cambios en la ima- 
gen de la retina que ocurren cuando nos movemos en una habitación y examinamos 
su contenido desde diversos ángulos. A pesar del flujo visual, los objetos parecen 
permanecer en el mismo sitio.»!?2 


La experiencia sensorial lleva información sobre, y por lo tanto repre- 
senta, no los eventos proximales de los que depende de forma causal, sino 
los antecesores más distantes en esta cadena causal. Y dado que los even- 
tos próximos no son representados, no están, a fortiori, representados en 
ninguna forma primaria. De hecho, ésta es la razón por la que no los vemos 
u oímos. Vemos (y oímos) a través de ellos. 

Una explicación plausible de los fenómenos de constancia es que nues- 
tros sistemas sensoriales son sensibles, no a estímulos localizados (por 
ejemplo, la luz reflejada desde el objeto X), sino a características más glo- 
bales del patrón del estímulo completo (por ejemplo, las diferencias entre 
la luz reflejada por X y la luz reflejada por el entorno de X).!** Una forma 
de describir esto es decir que nuestros sistemas perceptivos son sensibles 
a variables «de orden más alto» en la serie de estímulos. Los circuitos neu- 
ronales en el córtex visual no son sensitivos al estímulo x (luz que alcanza 
la retina desde x) y a los estímulos locales y (luz que alcanza la retina desde 
Y), sino a varias proporciones, gradientes y tasas de cambio en o entre las 
contrapartes locales (proximales) de los estímulos distantes. Así, por ejem- 
plo, lo que explica la constancia del brillo no es (únicamente) la intensidad 
de la luz proveniente de X (ésta puede cambiar radicalmente sin ningún 
cambio aparente en brillo), sino la relación entre las intensidades prove- 
nientes de X y su entorno (objetos cercanos). Lo que explica la constancia 
del tamaño es (entre otras cosas) la cantidad relativa de detalles de textura 
(en el trasfondo) que el objeto ocluye. Dado que hay un gradiente en el 
campo de las texturas, la cantidad de textura ocluida permanecerá con- 
siente cuando el objeto se aleja. Aparte de estas variables de alto nivel, 
también parece claro que nuestra experiencia sensorial está determinada, 





132 R, Woodworth, Experimental Psychology, Londres, Methuen, 1938, pág. 595. 


133 Véase la excelente ilustración de este punto de Edwin H. Land en «The Retinex of Color 
Vision», Scientific American, vol. 237, n? 6, diciembre 1977, págs. 108-128. 
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por lo menos en parte, por información proveniente de otras modalidades 
sensoriales.!%* Esto es, el sistema perceptivo «toma en consideración» la 
información acerca de la inclinación del cuerpo (en relación a la gravedad), 
la posición y movimiento de los ojos, cabeza y tronco, etcétera.!* 

Tales explicaciones son bastante plausibles, y no deseo discutirlas. Son 
cuestiones que deben dejarse para los especialistas científicos. El único 
punto que me concierne aquí es que, cualquiera que sea la explicación co- 
rrecta de los fenómenos de constancia, ciertamente existen. Y la externa- 
lidad de los objetos perceptivos depende de la existencia de tales fenóme- 
nos (no de su explicación correcta). Lo que explica el hecho de que nuestra 
experiencia sensorial da representación primaria a las propiedades de ob- 
jetos distantes y no a las propiedades de aquellos eventos más próximos 
de los que depende (de forma causal) es el hecho de la constancia, no su 
base psicológica o neurológica. Este hecho es lo que explica por qué ve- 
mos los objetos físicos y no los efectos que estos objetos tienen en nuestros 
sistemas perceptivos. 

El que veamos o no objetos físicos estándares es (en esta visión de las 
cosas) una cuestión empírica, algo que debe ser decidido mirando el tipo 
de información imbuida en nuestra experiencia sensorial. Existe, como he 
tratado de indicar, una cantidad impresionante de evidencia experimental 
para apoyar el punto de vista de que nuestra experiencia visual (y, en me- 
nor medida, las demás modalidades sensoriales) transporta información 
altamente específica sobre las propiedades de objetos ordinarios sin llevar 
el mismo tipo de información específica sobre los eventos intermedios res- 
ponsables de la transmisión de esta información. Existe, por tanto, un im- 
presionante cuerpo de evidencia para apoyar el punto de vista de sentido 
común de que vemos árboles, gatos, gente y casas y nos vemos los eventos 
neurológicos (periféricos o centrales) que están igualmente «involucra- 
dos» (de forma causal) en la producción de nuestra experiencia. 





134 Por ejemplo: «En constantes para objetivos gravitacionalmente orientados, la entrada 
visual debe ser procesada juntamente con información sobre la inclinación del cuerpo, puesto 
que en ausencia de lo segundo, la entrada visual es totalmente insuficiente para llevar la in- 
formación sobre la orientación gravitacional.» Sheldon M. Ebenholtz, «The Constancies in 
Object Orientation: An Algorithm Processing Approach», en Stability and Constancy in Vi- 
sual Perception, William Epstein (ed.), Nueva York, 1977, pág. 82. 


135 Véase William Epstein, «The Process of “Taking-into-Account” in Visual Perceptiom», 
Perception, vol. 2 (1973), págs. 267-285. 
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Esto no implica que nuestro modo de procesar información sensorial 
no pueda cambiarse para generar objetos de percepción diferentes. El psi- 
cólogo J. J. Gibson ha sugerido una distinción entre el mundo visual y el 
campo visual.'3% Según Gibson, el mundo visual consiste de nuestro 
mundo cotidiano de sillas, árboles, edificios y personas. Estas son las cosas 
que vemos en condiciones de percepción normales. Sin embargo, podemos 
situarnos en un marco mental diferente —lo que es llamado algunas veces 
un marco mental fenomenológico— o situarnos en condiciones de percep- 
ción anormales (en la llamada «reducción perceptual», donde la mayor 
parte de la información es eliminada del estímulo), en las que (según Gib- 
son) percibimos una constelación de objetos diferentes. En estos estados 
alterados ya no vemos un mundo de objetos estable, sino un conjunto de 
entidades que varían continuamente —cosas que están cambiando sin ce- 
sar su brillo y color (conforme la iluminación cambia), su tamaño y forma 
(conforme ellas y nosotros nos movemos), su posición y orientación. En 
tales condiciones de percepción alteradas (o reducidas), ya no se puede 
decir que el sujeto ve objetos físicos. Nuestra experiencia visual todavía 
transporta información sobre los objetos físicos, pero a las propiedades de 
estos objetos ya no se les otorga una representación primaria en la expe- 
riencia sensorial. 

La posibilidad de confrontar un campo visual en vez de un mundo vi- 
sual plantea la cuestión acerca de lo que los niños y los animales perciben. 
Ellos miran el mismo mundo que nosotros, y sin duda reciben la mayor 
parte de la misma información que nosotros, pero ¿cómo codifican esta 
información de forma perceptiva? Podría ser que a la vez que maduramos 
desarrollásemos una forma diferente de codificar información sensorial, 
de tal forma que (en referencia a la figura 6-2.) comenzamos representando 
las propiedades de d (por ejemplo, que es E) y, sólo más tarde, tras una 
interacción constante con aquellas señales que transportan información, 





136 James J. Gibson, The Perception of the Visual World, Boston, 1950, capítulo 3. Irvin 
Rock, siguiendo a Arien Mack, refiere a estos dos aspectos de la experiencia perceptiva como 
el modo de constancia y el modo de proximidad. Señala que en el caso del tamaño, percibi- 
mos tanto en el modo de proximidad como en el de constancia, y que en condiciones de 
reducción, el modo de percepción de proximidad pasa al centro de la escena. «Ya no existe 
un percepto dominante objetivo que lo supere» (pág. 346). Véase Rock: «In Defense of Uco- 
nscious Inference», en Stability and Constancy in Visual Perception, William Epstein (ed.), 
Nueva York, 1977, págs. 339, 342. 
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empezamos a dar representación primaria (por ejemplo, B) a propiedades 
más distantes. Esto es, nuestra experiencia perceptiva puede desarrollarse 
moviendo el objeto perceptivo más lejos, lejos del organismo que lo per- 
cibe. Puede que los niños vean literalmente un mundo diferente del de los 
miembros adultos de la especie. !?” 

Por muy paradójico que esto parezca, podemos observar algo compa- 
rable en nuestro procesamiento auditivo de información. Cuando escucha- 
mos un lenguaje que no nos es familiar, oímos (como lo expresamos a 
menudo) sonidos, pero no palabras. No sirve decir que dado que los soni- 
dos que oímos son palabras, oír los sonidos es oír las palabras. Los sonidos 
tienen un determinado tono y timbre: la palabra «oso» no posee ninguna 
de esas propiedades. Y la cuestión de si oímos el sonido «oso» o la palabra 
«oso» es una cuestión de si nuestra experiencia auditiva da una represen- 
tación primaria a las propiedades del sonido o a las propiedades de la pa- 
labra. Los estudios sugieren que la forma en que codificamos información 
cuando escuchamos un lenguaje familiar es diferente de la forma en que 
lo hacemos cuando prestamos atención a lenguaje que no nos es familiar. 
Con un lenguaje familiar, oímos pausas entre las palabras incluso cuando 
el sonido es continuo (ninguna parada en la energía acústica). Oímos suti- 
lezas asociadas con la estructura gramatical y el significado de la expresión 
que están totalmente ausentes del patrón de vibraciones acústicas que lle- 
gan a los receptores auditivos.!*$ Hasta cierto punto al menos, aprender un 





137 Aunque la experiencia perceptiva pueda desarrollarse de este modo, cada día hay más 
pruebas que sugieren que no lo hace. Los experimentos con niños de T. G. R. Bower revelan 
que no era la similitud en la retina, sino la similitud (distante) de los objetos lo que generó la 
mayoría de las respuestas. «Más que ser el tipo más primitivo de capacidad perceptiva, parece 
que la capacidad para registrar la información en la imagen de la retina puede ser un talento 
altamente sofisticado y puede que tenga que ser aprendido.» Véase Bower: «The Visual 
World of Infants», Scientific American, diciembre 1966, reimpreso en Perception: Mecha- 
nism and Models, San Francisco, 1972, pág. 357. 


138 Véase J. A. Fodor y T. G. Bever, «The Psychological Reality of Linguistic Segments», 
Journal of Verbal Learning and Verbal Behaviour, vol. 4 (1965), págs. 414-420, y M. Ga- 
rrett, T. Bever, y J. Fodor, «The Active Use of Grammar in Speech Perception», Perception 
and Psycho- physics, vol. 1 (1966), págs. 30-32. Fodor lo expresa de esta forma: «Se podría 
decir que uno no oye las relaciones que se forman en la expresión de frases incluso si uno 
oye las relaciones lingúísticas, y la estructura que se forma (inter alia) determina de manera 
causal cuáles son las relaciones lingilísticas que uno oye», The Language of Thought, Nueva 
York, 1975, pág. 50. 
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lenguaje es empezar a oír propiedades asociadas con las palabras y las fra- 
ses y dejas de oír propiedades acústicas. 

No sé si ocurre algo similar cuando un niño «aprende» a ver el mundo. 
La mayor parte de nuestro aprendizaje consiste en nuestra mayor utiliza- 
ción cognitiva de la información que ya está perceptualmente disponible 
en alguna representación sensorial determinada (por ejemplo, el paso de 
ver un narciso a ver que es un narciso). En un aprendizaje tal no existe un 
cambio perceptivo significativo, no hay un cambio en lo que vemos. Sola- 
mente existe un cambio en lo que sabemos sobre lo que vemos. Pero existe 
la posibilidad de que el proceso hacia la madurez normal incluya un cam- 
bio, no sólo en nuestras fuentes cognitivas, sino en la forma en que las 
cosas son representadas por la percepción. Si esto ocurre, y en qué medida, 
es una cuestión científica, no filosófica. 

Sin embargo, debería subrayarse un extremo antes de abandonar el exa- 
men del objeto de la percepción. El hecho de que un animal eluda los obs- 
táculos y los predadores con éxito, el hecho de que localice comida y pa- 
reja de forma eficiente, es un hecho que no es una guía cierta para lo que 
ve, oye, huele o gusta. El éxito en estas actividades prácticas nos dice algo 
sobre las habilidades cognitivas del animal, pero no nos ofrece un criterio 
infalible para determinar la forma en que se representa en la percepción 
los elementos a su alrededor. Un conejo, por ejemplo, no necesita dar re- 
presentación visual primaria al zorro, no necesita ver al zorro para obtener 
información detallada y precisa por medios visuales acerca de la localiza- 
ción, movimientos e identidad del zorro. El hecho de que contesto a la 
puerta cada vez que alguien aprieta el botón del timbre, el hecho de que 
sea tan extraordinariamente sensible a la posición del botón del timbre, no 
significa que pueda oír (o sentir de alguna forma) que se presiona el botón. 
Lo único que significa es que algo que sí oigo, lleva información precisa 
sobre el estado del botón del timbre. Decir que sé que se ha dejado de 
presionar este botón (para especificar el objeto de mi estado cognitivo), y 
que sé esto a través de medios auditivos, no significa que lo oiga. Como 
todos sabemos, lo que realmente oigo es el timbre. Es quien «me dice» que 
hay alguien en la puerta apretando el botón. El éxito práctico al responder 
a la presencia de alguien en mi puerta, incluso si este éxito ha de explicarse 
en términos auditivos, no implica que puedo oír a gente en la puerta. Y, 
por la misma razón, el éxito del conejo en eludir al zorro no debería con- 
siderarse que implica que el conejo puede ver, oír u oler al zorro. Desde 
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luego, puede que lo haga, pero se necesitarán algo más que hechos acerca 
de las capacidades cognitivas del conejo para justificar esta conclusión. 
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TERCERA PARTE 


SIGNIFICADO Y CREENCIA 
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7. Codificación y contenido 


Hemos usado provisionalmente el concepto de creencia para distinguir 
los sistemas cognitivos genuinos de los meros procesadores de informa- 
ción. Un magnetófono recibe, procesa y almacena información. Pero a di- 
ferencia de los sujetos humanos expuestos a la misma señal acústica, el 
aparato electrónico es incapaz de convertir esta información en algo con 
significación cognitiva. El aparato no sabe lo que nosotros podemos llegar 
a saber si la usamos. La razón de ello es que la información que el magne- 
tófono recibe no genera ni apoya una creencia apropiada. 

Pero, ¿qué es una creencia? ¿Qué hace que algunos sistemas puedan 
albergar estados de creencia y otros no? ¿Pueden los computadores tener 
creencias? ¿Y las ranas? ¿Y los gusanos? No decimos que un termostato 
tiene una creencia por el hecho de que «detecte» un descenso en la tempe- 
ratura ambiental y responda apropiadamente enviando una señal a la cal- 
dera. Sin embargo, si yo hiciera esto, si yo notase que se está enfriando el 
ambiente e hiciera algo para calentarlo un poco más, se me atribuiría toda 
una constelación de creencias: la creencia de que la habitación se está en- 
friando, la creencia de que unos cuantos leños más en el fuego calentarían 
un poco más el ambiente, etc. ¿Por qué? ¿Cuál es la diferencia? 

La explicación del conocimiento basada en la teoría de la información 
quedará seriamente incompleta en la medida en que no ofrezca una expli- 
cación de la creencia. No es de gran importancia el nombre que le demos 
a esta capacidad especial, esta capacidad que distingue los sistemas cogni- 
tivos genuinos de meros conductos de información, como termostatos, vol- 
tímetros y magnetófonos. Lo importante es que tengamos un modo de dis- 
tinguir dos tipos de sistemas que procesan información: el tipo que puede 
convertir la información que recibe un conocimiento y el tipo que no puede 
hacerlo. Lo que queremos es poder decir qué es lo que tiene la primera 
clase de sistema que no tiene la segunda, y que permite atribuirle propie- 
dades cognitivas; qué es lo que tenemos nosotros, e incluso lo que tiene 
nuestro gato, que nos permite saber que empieza a hacer frío en el am- 
biente mientras que el termostato, aun que recoja la misma información, 
no sabe nada de todo esto. No es suficiente decir que creemos que empieza 
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a hacer frío en la habitación mientras que el termostato no lo cree. Eso es, 
desde luego, verdad, pero, en último término, ¿a qué se debe? 

Sabemos por un capítulo anterior que todos los sistemas que procesan 
información albergan estados intencionales de un cierto nivel inferior. 
Describir un estado físico como portador de información acerca de una 
fuente de información, es considerar que alberga un cierto estado intencio- 
nal relativo a tal fuente. El que la estructura S lleve la información de que 
t es F, no quiere decir que lleve necesariamente la información de que f es 
G, incluso aunque no haya nada que sea F que no sea también G. La infor- 
mación que se expresa en una estructura define un contenido proposicional 
que tiene características intencionales. 

Pero para que se puedan atribuir a un sistema propiedades cognitivas, 
éste debe ser capaz de albergar estados intencionales de nivel superior. 
Por conveniencia, y para ayudar a clarificar este punto tan importante, 
identificaremos tres niveles de intencionalidad. 


Primer nivel de intencionalidad 
a) Todos los F' son G. 
b) S tiene el contenido de que 1 es F. 
Cc) S no tiene el contenido de que 1 es G. 


Cuando esta tríada de enunciados es consistente, diré que S (alguna 
señal, suceso o estado) tiene un contenido que manifiesta el primer nivel 
de intencionalidad. Así, por ejemplo, incluso aunque todos los niños de 
Elmer tengan el sarampión, y S lleve la información (tenga el contenido) 
de que £ es uno de los niños de Elmer, S puede no llevar la información 
(tener el contenido) de que f tiene el sarampión. Todos los sistemas que 
procesan información presentan este primer nivel de intencionalidad. 


Segundo nivel de intencionalidad 
a) Es una ley natural que los F son G. 
b) S tiene el contenido de que 1 es F. 
c) S no tiene el contenido de que tes G. 


Cuando esta tríada es consistente, el contenido S presenta el segundo 
nivel de intencionalidad. Por ejemplo, uno puede creer (saber) que el agua 
se está helando sin creer (saber) que el agua está aumentando de volumen 
incluso aunque (digámoslo así) sea nómicamente imposible que el agua se 
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hiele sin dilatarse, incluso aunque haya una ley natural que nos diga que el 
agua aumenta de volumen cuando se hiela. 


Tercer nivel de intencionalidad 
a) Es analíticamente!*” necesario que los F sean G. 
b) S tiene el contenido de que 1 es F. 
c) S no tiene el contenido de que 1 es G. 


Cuando esta tríada es consistente, el contenido de S presenta el tercer 
nivel de intencionalidad. Uno podría saber (creer) que la solución de una 
ecuación es 23 sin saber (creer) que la solución es la raíz cúbica de 12.167. 
El hecho de que sea matemáticamente (analíticamente) imposible que 23 
sea otra cosa que la raíz cúbica de 12.167 no hace imposible que uno sepa 
que £ = 23 (y, por tanto, que esté en un estado cognitivo que tenga ese 
contenido) sin saber que £ = la raíz cúbica de 12.167 (es decir, sin estar en 
un estado cognitivo con tal contenido). 

Como los ejemplos anteriores indican, el conocimiento y la creencia 
tienen un nivel superior de intencionalidad. Debe diferenciarse lo que cree- 
mos, y por tanto las creencias mismas, incluso cuando sus contenidos sean 
interdependientes. Llamaré contenido semántico a cualquier contenido 
proposicional que presente el tercer nivel de intencionalidad. 

Una señal (estructura, estado, suceso) no posee esta intencionalidad de 
orden superior con respecto a su contenido informativo. Si las propiedades 
F y G están relacionadas nómicamente (es decir, hay una ley natural de 
manera que siempre que algo tenga la propiedad F, también tiene la pro- 
piedad G), entonces cualquier estructura que lleve la información de que + 
es F lleva también, necesariamente, la información de que £ es G. En 
efecto, la información de que £ es G estará incluida en la situación descrita 
por «t es F» de tal manera que ninguna señal podrá llevar una de las infor- 
maciones sin llevar también la otra. 





139 Si el lector tiene objeciones quineanas a la idea de analiticidad, la distinción entre el 
segundo y el tercer nivel de intencionalidad se puede simplemente considerar como una cues- 
tión de grado y no de clase. No deseo defender la distinción analítico-sintético, ni pienso que 
nada de lo que he dicho en este ensayo depende de esta distinción, pero encuentro que la 
palabra «analítico» es un término útil para sugerir toda una serie de casos que han interesado 
alos filósofos y la uso aquí para indicar tales casos. 
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Lo que vale para las implicaciones nómicas vale también, a fortiori, 
para las implicaciones analíticas. Si «tf es F» implica lógicamente «tf es G», 
entonces es imposible que una señal o estado que lleve la información de 
que tes F no lleve consigo la información de que 1 es G. Los sistemas que 
procesan información son incapaces de separar la información de que t es 
F de la información incluida en el hecho de que 1 sea F. Es imposible di- 
señar un filtro que deje pasar, por ejemplo, la información de que 1 es F 
sin dejar pasar la información de que 1 es G. 

Por lo tanto, una creencia manifiesta una intencionalidad de grado su- 
perior al que presenta una estructura con respecto a su contenido informa- 
tivo. Se puede decir que ambas tienen un contenido proposicional, a saber, 
el contenido de que t es F, pero la creencia lo tiene como contenido exclu- 
sivo (con exclusión, al menos, de informaciones relacionadas nómina y 
analíticamente), mientras que la estructura informativa no. Una estructura 
física no puede tener, como contenido informativo, el hecho de que 1 es F 
sin tener como parte de su contenido informativo toda la información in- 
cluida en el hecho de que £ sea F. Por esta razón una estructura física no 
tiene un contenido informativo determinado o exclusivo. Aunque puede 
calificarse a las informaciones expresadas en una estructura física de con- 
tenidos preposicionales que presentan características intencionales (de pri- 
mer nivel), no puede decirse que tengan el tipo de contenido semántico 
característico de la creencia. Para que un sistema albergue un estado de 
creencia, debe discernir de alguna manera entre las informaciones que se 
contienen en una estructura física y seleccionar una de ellas para un trata- 
miento especial, considerándola como el contenido del estado intencional 
de nivel superior que ha de identificarse como la creencia. 

Ya anteriormente distinguíamos el concepto de información del de sig- 
nificado (capítulo 2, en El concepto común de información). La proferen- 
cia de Margaret «Estoy sola» significa que ella está sola (esto es lo que 
significan las palabras que ella pronuncia) aun cuando su proferencia no 
logre dar esta información (por ejemplo, cuando ella no esté sola). Y 
cuando su proferencia lleve realmente la información de que está sola, 
debe también llevar la información de que no está tomando el vermut con 
Henry Kissinger. Sin embargo, aunque su proferencia lleve necesaria- 
mente la segunda información siempre que lleva la primera, esa proferen- 
cia significa que ella está sola sin significar que no está bebiendo martinis 
con Henry Kissinger. El hecho de que Henry Kissinger no esté instalado 
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cómodamente en su apartamento con una bebida en sus manos es algo que 
ciertamente está implicado en lo que dijo Margaret, pero no forma parte 
de lo que dijo: no forma parte del significado de su proferencia (aunque 
podría formar parte de lo que ella quiso comunicamos al decirnos lo que 
dijo). De igual manera, una señal (por ejemplo, la proferencia «El agua se 
está helando») puede significar que el agua se está helando sin significar 
que el agua se esté dilatando, aun cuando no pueda llevar la primera infor- 
mación sin llevar la segunda. Es decir, el significado, como la creencia (y 
otros estados cognitivos), muestra una intencionalidad de un orden supe- 
rior a la que atribuimos al contenido informativo de una estructura. Dado 
que la creencia y el significado parecen tener el mismo nivel de intencio- 
nalidad, o al menos un nivel similar, puesto que ambos tienen un contenido 
semántico, no puede ser demasiado poco razonable esperar que una expli- 
cación satisfactoria de la creencia nos proporcione una de las claves para 
una comprensión más profunda del significado. 

El primer tema del que debemos ocuparnos es, por tanto, entender el 
modo en que estructuras intencionales de nivel superior pueden confeccio- 
narse a partir de estados intencionales de nivel inferior. Tendremos, pues, 
que describir la forma en que pueden desarrollarse las estructuras que tie- 
nen un contenido semántico (tercer nivel de intencionalidad) a partir de 
estructuras que son portadoras de información. 

Una vez se haya hecho esto, estaremos en disposición de describir, en 
el próximo capítulo, la estructura de la creencia. Esta explicación es nece- 
saria para completar el análisis del conocimiento basado en la teoría de la 
información (al suministrar una explicación de la creencia en términos de 
la teoría de la información), para aclarar la diferencia entre los mecanismos 
que simplemente procesan información (los dictáfonos, los televisores, los 
voltímetros) y los sistemas cognitivos genuinos (las ranas, los seres huma- 
nos y quizás algunos computadores), y, finalmente, para revelar la base 
naturalista que subyace al conjunto de atributos mentalistas que asignan 
un contenido semántico a los estados internos de uno mismo. 

Supongamos que la estructura S constituye una representación analó- 
gica del hecho de que : es F. Decir que S lleva esta información en forma 
analógica es decir (tal como vimos en el capítulo 6) que S lleva una infor- 
mación más específica, más determinada sobre £ que, simplemente, el he- 
cho de que sea F. Lleva la información de que £ es K, donde el hecho de 
que £ sea F está incluido, tanto nómica como analíticamente, en el hecho 
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de que £ sea K (pero no a la inversa). Por ejemplo, S podría llevar en forma 
analógica la información de que f es una persona, llevando la información 
de que f es una señora mayor —al modo en que una fotografía de £ lleva la 
información de que f es una persona al mostrar a £, por decirlo así, como 
una señora mayor. No es que la fotografía de una persona (que es una se- 
ñora mayor) deba presentar a la persona como una señora mayor, pero si 
es una fotografía de una persona, debe revelar algo más específico sobre 
la persona que el que ésta lo es (su postura, su tamaño, su vestimenta, su 
orientación, etc.). 

Si buscamos la forma de identificar (o definir) el contenido semántico 
de una estructura, aquel contenido proposicional más o menos único que 
mostraba características intencionales de nivel superior, y si tratamos de 
localizar tal contenido entre los componentes informativos de la estructura, 
hay poca esperanza de encontrarlo entre las informaciones que la estruc- 
tura lleva en forma analógica. En efecto, en la medida en que S es una 
representación analógica del hecho de que 1 sea F, S debe llevar informa- 
ciones más específicas, informaciones que están tan capacitadas para ser- 
vir como contenido semántico de S —o quizá mejor aún— de lo que lo 
está el hecho de que 1 es F. Pues si S lleva la información de que t es F 
(por ejemplo, que £ es una persona) en forma analógica, S debe llevar in- 
formación (por ejemplo, que f es una señora mayor) que es superflua desde 
el punto de vista de la identificación de £ como una persona. Y esta infor- 
mación superflua tiene tanto derecho a llamarse contenido semántico de S 
como cualquier otra información expresada en S. Incluso podría parecer 
que tiene mayor derecho, que sus cualidades son más impresionantes, pues 
si se propone la información de que f es una persona como contenido se- 
mántico de S, con exclusión de la información incluida en el hecho de que 
f sea una persona (por ejemplo, que f es un mamífero, que f es un animal), 
entonces ¿por qué no identificar el contenido semántico de S con el hecho 
de que f es una señora mayor, con exclusión de la información incluida en 
ese hecho —excluyendo, en especial, el hecho de que f es una persona? 

La cuestión es, simplemente, la siguiente: si tratamos de identificar un 
componente informativo de S más o menos único, algo que pudiera servir 
plausiblemente como contenido semántico de $, entonces cualquier infor- 
mación en forma analógica queda inmediatamente descalificada, puesto 
que si una información / se contiene en forma /, junto con múltiples infor- 
maciones diferentes (todas las que están incluidas en /), está incluida, tanto 
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nómica como analíticamente, en alguna otra información /”. Esto es una 
consecuencia del hecho de que / se transmita en forma analógica. Por lo 
tanto, no hay nada especial sobre /, nada que la separe de las otras infor- 
maciones incluidas en /”, nada que la pudiera calificar como el contenido 
(y, por ello, como el contenido semántico) de S. Si buscamos identificar 
un componente informativo único de S, sería mejor que miráramos a 1”, el 
componente en el que está incluida toda otra información. Al menos parece 
ser único. Es la única información que S lleva en forma digital. 

Esta sugerencia es la que pretendo desarrollar en lo que queda de capí- 
tulo. El contenido semántico de una estructura es aquella información que 
la estructura lleva en forma digital. S leva la información de que tes F en 
forma digital si y sólo si ésa es la información más específica sobre t que 
lleva S.!'* Como espero demostrar, una estructura presenta, con respecto a 
la información que lleva en forma digital, una intencionalidad de grado 
superior que la que presenta con respecto a la otra información que esa 
estructura contiene. En realidad presenta las características intencionales 
de una creencia genuina.!*' Este hecho formará la base de nuestra consi- 
guiente identificación de la creencia de que £ es F con una representación 
digitalizada de este hecho (o presunto hecho; véase la nota 3). Las creen- 
cias se generan no por la información codificada, sino por la forma en que 
un sistema codifica la información. 


t es un cuadrado 


y S 
tes un rectángulo 





140 Más técnicamente, S lleva la información de que f es F en forma digital si 1) S lleva la 
información de que £es F, y 2) no hay otra información, tes K, que sea tal que la información 
de que 1 es F esté incluida en el hecho de que f sea K, pero no a la inversa. 


141 La mayoría de las características intencionales de una creencia, pero quizás no todas. 
Dependerá de lo que se considere que se incluye en la idea de intencionalidad. Se debería 
señalar, por ejemplo, que las creencias pueden ser falsas (tener contenidos falsos), pero la 
información que lleva una estructura en forma digital no puede ser falsa (porque es informa- 
ción). Por eso, la definición de contenido semántico que se da más adelante, es decir, una 
definición que identifica el contenido semántico de una estructura con la información que 
lleva en forma digital, nos proporciona un contenido proposicional que presenta el tercer 
nivel de intencionalidad (según argumentaré), pero no nos da todavía un contenido que se 
pueda calificar de contenido de una creencia. Si se considera que la posible falsedad del con- 
tenido de una estructura forma parte de lo que se quiere decir con intencionalidad, entonces 
las estructuras semánticas no presentan todas las características intencionales de la creencia. 
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t es un paralelogramo 
tf es un cuadrilátero 


Digamos, aunque sea en un primer intento, que luego habrá que modi- 
ficar ligeramente, que 


La estructura S tiene al hecho de que £ es F' como contenido semántico = S 
lleva en forma digital la información de que tes F. 


t es un cuadrado 

t es un rectángulo 

t es un paralelogramo 
t es un cuadrilátero 


(FIG. 7.1) 


Así, por ejemplo, si una señal lleva la información de que f es un cua- 
drado, pero no lleva ninguna información más específica sobre £ (cuadrado 
rojo, cuadrado azul, cuadrado pequeño, etc.), entonces S lleva la informa- 
ción de que f es un cuadrado de manera digital, y por eso tiene esta infor- 
mación como contenido semántico. Nótese que al llevar esta información 
de manera digital, S lleva en forma analógica gran cantidad de otras infor- 
maciones: por ejemplo, la información de que f es un paralelogramo, de 
que f es un rectángulo, de que f es un cuadrilátero. Todas ellas son infor- 
maciones que están incluidas analíticamente en el hecho de que £ sea un 
cuadrado. Por supuesto, también existe la posibilidad de que ciertas infor- 
maciones estén incluidas nómicamente en el hecho de que £ sea un cua- 
drado. La situación se describe en la figura 7-1. S lleva estas cuatro infor- 
maciones y además, probablemente, muchas otras más. La propuesta an- 
terior sugiere que identifiquemos el contenido semántico de S con su capa 
informativa más externa, aquella información en la que se encuentra in- 
cluida (tanto nómica como analíticamente) toda otra información que S 
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lleve. Por supuesto que lo anterior no es sino otra forma de decir que el 
contenido semántico de S tiene que identificarse con aquella información 
que S lleva de manera digital. Pues cada capa informativa interior repre- 
senta una información que se contiene en forma analógica. Así, por ejem- 
plo, S lleva la información de que t es un paralelogramo en forma analógica 
ya que S lleva una información más específica sobre la clase de paralelo- 
gramo que es í, a saber, un rectángulo. 

Es importante darse cuenta de que la definición anterior de «contenido 
semántico» nos proporciona una noción que posee propiedades intencio- 
nales de nivel superior. Si S lleva la información de que 1 es F, y la infor- 
mación de que f es G está incluida en el hecho de que £ sea F, se sigue 
entonces que S lleva la información de que f es G. S no puede tener la 
primera información como parte de su contenido informativo sin tener 
también la segunda como parte de él. Sin embargo, y éste es el hecho im- 
portante, S tiene la primera información como contenido semántico sin te- 
ner también la segunda como contenido semántico, y esto es debido a que 
S lleva la información de que 1 es F en forma digital mientras que éste no 
es el caso con la información de que t es G. A este respecto el contenido 
semántico de S es único de un modo en que no lo es su contenido informa- 
cional. Y esta singularidad la produce el hecho de que hemos identificado 
el contenido semántico con la información que está codificada de una de- 
terminada manera. Dejando, por el momento, sutilezas aparte, una estruc- 
tura puede tener codificado en forma digital sólo un componente de su 
contenido informativo, sólo una capa informativa externa, y éste es su con- 
tenido semántico. 

Esto sugiere que las estructuras semánticas, tal como las hemos defi- 
nido, tienen el mismo nivel de intencionalidad que las creencias y que, por 
lo tanto, constituyen la analogía ideal de la creencia en la teoría de la in- 
formación. Las creencias son estructuras que tienen un contenido semán- 
tico, y es este contenido semántico el que define el contenido de la creencia 
(lo que se cree). Espero que al final pueda confirmar esta ecuación, o algo 
muy parecido a ella, pero por el momento la identificación es un poco pre- 
matura. Se debe señalar, por ejemplo, que las creencias (o, al menos, la 
mayoría de ellas) son el tipo de cosas que pueden ser falsas (el contenido 
de una creencia puede ser falso), mientras que una estructura no puede 
tener un contenido falso (puesto que su contenido se define en términos de 
la información que lleva la estructura). Hay que hacer notar también algo 
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a lo que hasta aquí no le hemos prestado atención, y es que algunas veces 
la información de que £ es G no está incluida en el hecho de que £ sea F, ni 
la información de que 1 es F incluida en el hecho de que 1 sea G, sino que 
estas informaciones son equivalentes (tanto lógica como nómicamente). 
Es decir, las capas informativas coinciden. Consideremos, por ejemplo, la 
información de que f es un cuadrado y la información de que f es un cua- 
drilátero que tiene los lados y los ángulos iguales. Podemos suponer que 
puesto que estas informaciones son equivalentes, cualquier codificación 
digital de una información es automáticamente una codificación digital de 
la otra. Así pues, cualquier estructura que tenga una de ellas como conte- 
nido semántico debe tener también la otra como contenido semántico. 
¿Pero podemos decir lo mismo de las creencias? ¿Si alguien cree que £ es 
un cuadrado, debe también creer que £ es un cuadrilátero que tiene los lados 
y los ángulos iguales? Sobre esta cuestión puede que las opiniones difie- 
ran. Sin embargo, el mismo problema se puede plantear en términos de 
equivalencias nómicas (no analíticas). Supongamos que las propiedades 
y G están relacionadas por una ley natural de tal manera que todo lo que 
tenga una propiedad tiene también la otra, y viceversa. Entonces cualquier 
estructura que tenga el contenido semántico de que 1 es F debe tener tam- 
bién el contenido semántico de que t es G (y viceversa). Seguramente, sin 
embargo, se puede creer que £ es F sin creer que t es G. El que lo crea 
puede no darse cuenta de que son propiedades nómicamente equivalentes. 

Pronto volveré a estas importantes cuestiones. Por el momento pienso 
que vale la pena describir, de forma algo más detallada, las propiedades 
especiales —y también muy sugerentes— que tienen las estructuras se- 
mánticas (= las estructuras de las que se piensa que tienen un contenido 
que corresponde a la información que llevan en forma digital). 

Nótese, en primer lugar, que las estructuras semánticas son sensibles o 
responden a una información determinada, a saber, aquella información 
que define su contenido (semántico). Supongamos que llega una señal que 
lleva la información de que £ es un cuadrado rojo. Supongamos, además, 
que un sistema procesa esta información de tal manera que algún estado 
interno del sistema, llamémosle S, constituye una representación digital 
del hecho de que 1 es un cuadrado. S tiene, pues, como contenido semántico 
el hecho de que £ es un cuadrado. Obviamente S no es sensible a aquellas 
características de la nueva señal que lleven la información de que f es rojo. 
Una señal que llevara la información de que £ es un cuadrado azul también 
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sería capaz de producir S. Si no pudiera, entonces S, contrariamente a la 
hipótesis, no sería una representación digital del hecho de que f es un cua- 
drado (puesto que S llevaría información sobre el color de £, lo que la con- 
vertiría en una representación analógica del hecho de que £ sea un cua- 
drado). Aquellas características de la señal (si las hay) que llevan informa- 
ción sobre el color de £ son causalmente no pertinentes para la producción 
de S. S, por así decirlo, las ignora. De igual manera es insensible a la in- 
formación sobre todos aquellos aspectos de £ que son independientes (ana- 
lítica y nómicamente) del hecho de que £ sea un cuadrado (por ejemplo, su 
tamaño, su orientación, su localización). Esto es así en virtud del hecho de 
que $ es una codificación digital de la información de que tes un cuadrado. 

Además, S es también insensible a la información incluida en el hecho 
de que f sea un cuadrado (por ejemplo, la información de que f es un para- 
lelogramo). Aquellas propiedades de la señal que son responsables causal- 
mente de la producción de S no son las que llevan la información de que 
es un paralelogramo. Pues una señal que llevara esta información, pero no 
la de que £ es un cuadrado, sería incapaz de producir S (si lo hiciera, o si 
pudiera producir S, entonces S, contrariamente a la hipótesis, no llevaría 
la información de que f es un cuadrado). De ahí que, si bien cualquier señal 
que lleve la información de que f es un cuadrado lleva la de que £ es un 
paralelogramo (un rectángulo, un cuadrilátero, etc.), es sólo la primera in- 
formación la responsable causalmente de la producción de S. De ahí que, 
de toda la información que lleve una nueva señal, una estructura semántica 
sea sensible causalmente a un único componente de esta nueva informa- 
ción. Es sensible, sensible selectivamente si se quiere así, a aquel compo- 
nente de la nueva información que define el contenido semántico de la 
estructura. Es esta sensibilidad selectiva lo que es de capital importancia 
para la comprensión de la naturaleza de las estructuras semánticas (y, fun- 
damentalmente, de las creencias). 

En virtud de la manera singular en que codifica la información, en vir- 
tud de su selectividad, una estructura semántica puede verse como la in- 
terpretación de un sistema de nuevas señales que llevan información. La 
estructura constituye una interpretación en el sentido de que de los muchos 
componentes de información contenidos en las nuevas señales, la estruc- 
tura semántica caracteriza o ilumina uno de estos componentes a expensas 
de los otros. Hay una resolución del contenido, un enfocar más una cosa 
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que otra. Supongamos, por ejemplo, que tenemos un sistema con los re- 
cursos para digitalizar diferentes informaciones y con una especie de inte- 
rruptor para determinar qué información está digitalizada cuando dos in- 
formaciones lleguen en la misma señal. Supongamos que llega una señal 
que lleva la información de que f es un cuadrado rojo y que el sistema 
genera alguna representación analógica interna del cuadrado rojo sobre la 
base de la información contenida en esta señal. Esto, naturalmente, se su- 
pone que corresponde a la fase de percepción dentro del proceso percep- 
tivo-cognitivo total. La información contenida en esta representación (ana- 
lógica) interna puede ser digitalizada en ese momento de diferentes mane- 
ras. Dependiendo de la posición del «interruptor interno» se pueden gene- 
rar estructuras semánticas distintas. Con el interruptor en una determinada 
posición, el sistema digitaliza la información de que f es un cuadrado. Es 
decir, se produce una estructura que tiene esta información como conte- 
nido semántico. El sistema ha extraído esta información concreta a partir 
de la nueva señal y de la representación interna asociada a ella. Por otro 
lado, con el interruptor en una posición diferente, la representación per- 
ceptiva da lugar a una estructura semántica con el contenido: f es un rec- 
tángulo!*. En este caso el sistema ha interpretado la señal como algo que 
significa, simplemente, que £ es un rectángulo. Ha extraído esta informa- 
ción menos específica. El sistema ha visto un cuadrado rojo, pero sabe 
únicamente que es un rectángulo. 

El proceso que se acaba de describir, el de generar estructuras semán- 
ticas distintas a partir de la misma representación analógica interna, pre- 
tende corresponder a la forma en que la percepción de un cuadrado rojo 
(representación primaria interna del cuadrado rojo) puede producir creen- 
cias diferentes sobre el objeto (estructuras semánticas distintas) depen- 
diendo de la base cultural, experiencia, entrenamiento y atención del su- 
jeto. La clase de estructura semántica evocada por la nueva señal deter- 





142 O bien el contenido: f es rojo. Obviamente hay gran número de posibilidades (por ejem- 
plo, £ es un paralelogramo, f es una figura de alguna clase), una de las cuales, o cualquier 
combinación de ellas, podría realizarse en una ocasión determinada (dependiendo del inte- 
rruptor). El punto a recordar es, sin embargo, que cada uno de estos contenidos semánticos 
(diferentes) tendría que estar expresado en una estructura física diferente, ya que el contenido 
semántico de una estructura es la información que lleva en forma digital y estas informacio- 
nes diferentes no pueden ser digitalizadas en un mismo sistema por la misma estructura. 
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mina el modo en que el sistema interpreta lo que percibe, como un cua- 
drado, como un rectángulo, o como cualquier otra cosa. La transformación 
de una representación analógica del cuadrado en otra digital revela tam- 
bién (lo que ya vimos en el capítulo 6) el sentido en que en el paso del ver 
al saber está implicada alguna forma de generalización del estímulo. Al 
pasar de una representación analógica del hecho de que £ es F (digamos un 
cuadrado) a una representación digital de este mismo hecho, el sistema que 
hace la transformación necesariamente abstrae y generaliza, categoriza y 
clasifica. En realidad, otra forma de describir lo que es una generalización, 
una clasificación o una representación, es decir, que cada una de ellas im- 
plica la transformación de la información de la forma analógica en la forma 
digital. En efecto, si la información de que 1 es F llega en forma analógica, 
entonces la señal debe llevar la información de que £ es K donde el hecho 
de que algo sea K implica que es F y G (para alguna G). Para digitalizar la 
información de que £ es F, el sistema debe abstraer del hecho de que t es 
G. Debe clasificar esta K como una F. Debe generalizar, al tratar este 
ejemplar de F' como el mismo tipo de cosa que otros ejemplares de los que 
difiere (ejemplares que no son K). Hasta que la digitalización no ha tenido 
lugar, no ha ocurrido nada que se parezca a una clasificación de algo, o a 
subsumir ese algo bajo un concepto. La diferencia entre ver (oír, oler, etc.) 
un f que es F y creer o saber que £ es F es fundamentalmente la misma 
diferencia que existe entre una representación analógica y otra digital del 
hecho de que 1 es F. 

Esta es la razón de que un receptor de televisión no sepa o crea nada, a 
pesar del hecho de que recibe, procesa y exhibe cantidades enormes de 
información sobre objetos y sucesos situados en el estudio (y en otros lu- 
gares). La razón de que esta maravilla electrónica no pueda calificarse de 
sistema cognitivo es que es incapaz de digitalizar la información que pasa 
por ella. La información que el hombre del tiempo está señalando en un 
mapa es una información que este aparato es ciertamente capaz de recoger, 
procesar y volver a ofrecer al espectador. Si el aparato de televisión no 
pudiera transmitir esta información, entonces nosotros, los espectadores, 
no podríamos nunca llegar a saber lo que está pasando en el estudio con 
sólo atender al televisor. La diferencia crucial entre el espectador humano 
y el aparato es que éste es incapaz de digitalizar esta información en la 
forma en que lo hace el espectador humano. El receptor de televisión trans- 
forma servilmente la información disponible en la señal electromagnética 
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en imagen sin imponer sobre ninguna señal una estructura intencional cog- 
nitiva de nivel superior. Un sistema cognitivo no es un sistema que repro- 
duzca fielmente las entradas en las salidas, sino todo lo contrario. Si un 
sistema ha de exhibir propiedades cognitivas genuinas, debe asignar ¡gual- 
dad de salidas a diferencias en las entradas. A este respecto, un sistema 
cognitivo genuino debe representar una pérdida de información entre su 
entrada y su salida.!* Si no se pierde ninguna información, entonces no se 
ha digitalizado información alguna. Si en la entrada y en la salida se dis- 
pone de la misma información, el sistema que procesa esta información no 
ha hecho nada con ella (aparte de transformarla, tal vez, a una forma física 
diferente), no ha reconocido algunas diferencias como no pertinentes para 
la igualdad esencial, es decir, no ha categorizado o conceptualizado la in- 
formación que pasa por él. 

Así pues, el proceso por medio del cual una señal que lleva información 
se transforma en algo que tiene significación semántica (una estructura 
que, como una creencia o un conocimiento, tiene un contenido proposicio- 
nal que presente el tercer nivel de intencionalidad), es un proceso que in- 
cluye, entre otras cosas, un cambio en la forma en que se codifica una in- 
formación, a saber, una transformación de una representación analógica 
del hecho de que t sea F en otra digital. Todos estamos familiarizados con 
este proceso, descrito a otro nivel. Es la misma diferencia que se refleja en 
el con traste entre lo que una persona ve y aquello de lo que se entera. 

Hay una cuestión técnica, pero importante, relativa a esta caracteriza- 
ción del contenido semántico, que se debería tener en cuenta antes de in- 
tentar aplicarla —como haremos en el próximo capítulo— al análisis de la 
creencia. El hecho de que la estructura S no lleve ninguna información más 
específica sobre £ que la de que £ sea un cuadrado no significa automática- 
mente que la información de que f es un cuadrado constituya el anillo de 
información más externo de S. No significa que no haya capas de informa- 
ción más grandes en las que esté incluida esta información. Todo lo que 
se sigue es que no hay capas más grandes que representen una información 





143 La transformación de la información de la forma analógica a la forma digital implica 
siempre la pérdida de alguna información, pero no sucede que, a la inversa, cada pérdida de 
información represente un proceso de digitalización. Un receptor de radio, por ejemplo, 
pierde una porción significativa de la información que contiene la onda electromagnética 
(cuánto es lo que se pierde dependerá de la «fidelidad» del receptor), pero esta pérdida no es 
discriminativa ni selectiva con respecto a la información contenida en la señal. 
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más específica acerca de t. Puede suceder, por ejemplo, que S lleve infor- 
mación sobre algún otro objeto, r, y que la información de que f es un 
cuadrado esté incluida en esta otra información acerca de r. Si esto es así, 
entonces la información de que f es un cuadrado, aunque sea la informa- 
ción más específica que S lleve acerca de 1, está de todos modos incluida 
en la información que S lleva acerca de r. Además, la información relativa 
a r puede estar incluida en una información relativa a u. Esquemática- 
mente, es posible que tengamos la situación que se representa en la figura 
7-2: 


ues H 
resG 


tes F 


(FIG. 7.2) 


Si la capa más interna es la información más específica que lleva S 
acerca de 1, entonces, de acuerdo con nuestras definiciones, S lleva la in- 
formación de que f es F en forma digital. Por tanto, esta información cons- 
tituye el contenido semántico de S. Pero si resulta que el hecho de que r es 
G y el hecho de que u es H son las informaciones más específicas que S 
lleva sobre r y u, entonces S lleva también la información de que r es G y 
u es H en forma digital. Estas informaciones pueden calificarse también 
como contenido semántico de S. Contrariamente a las afirmaciones que 
hicimos con anterioridad, el contenido semántico de una estructura no es 
único. 

Podemos evitar esta amenazadora proliferación, y asegurar la deseada 
unicidad en el contenido semántico de una estructura, haciendo más es- 
tricta nuestra definición. Lo que necesitamos como contenido semántico 
de una estructura no es la información que ésta lleve en forma digital (pues 
podría haber muchas informaciones tales), sino su capa informativa más 
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externa, aquella información que incluya toda otra información (tanto ana- 
lítica como nómicamente). Hasta este momento, hemos estado suponiendo 
que la capa informativa más externa de una estructura era la misma que la 
información que en forma digital llevaba esa estructura. Vemos ahora que 
esta equivalencia no se da. Reconociendo este hecho, redefinimos el con- 
tenido semántico de una estructura como aquella información que lleva la 
estructura en forma completamente digitalizada (así es como voy a lla- 
marla). Es decir: 


Una estructura S tiene el hecho de que 1 es F' como contenido semántico = 

a) S lleva la información de que tes F y 

b) S no lleva ninguna otra información, r es G, tal que la información de que £ 
es F esté incluida (nómica o analíticamente) en el hecho de que r sea G. 


Esta definición implica que si $ tiene el hecho de que / es F como con- 
tenido informativo, entonces S lleva la información de que £ es F en forma 
digital. Pero no se mantiene la implicación inversa. Una estructura puede 
llevar la información de que f es F en forma digital sin tener este hecho 
como contenido semántico. En la figura 7-2, si suponemos que no hay ca- 
pas informativas más grandes, S tiene el hecho de que u es H como conte- 
nido semántico. Es la única información que está completamente digitali- 
zada. 

Para mostrar la importancia de esta modificación en nuestra definición, 
consideremos el siguiente caso. Alguien lee en el periódico que Elmer ha 
muerto. No se dan más detalles. Supongamos que ésta sea la información 
más específica que se comunica sobre el estado de Elmer. Esta informa- 
ción acerca de Elmer va incluida en la configuración del papel impreso 
que da la noticia de su muerte. Es decir, la aparición del enunciado «Elmer 
ha muerto» en el periódico es lo que lleva la información de que Elmer ha 
muerto. Si, por otro lado, una estructura (por ejemplo, la experiencia visual 
asociada con la visión de este enunciado en el periódico) lleva la informa- 
ción de que el enunciado «Elmer ha muerto» aparece en el periódico, en- 
tonces lleva también la información de que Elmer ha muerto. Esto es, en 
efecto, lo que permitiría que alguien que leyera ese enunciado en el perió- 
dico llegase a saber que Elmer murió. Pero no queremos decir que la ex- 
periencia visual asociada con la visión del enunciado «Elmer ha muerto» 
en el periódico tenga como contenido semántico que Elmer ha muerto. Por 
supuesto, ésta es la información más específica que la experiencia visual 
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lleva acerca de Elmer, y a este respecto lleva esta información en forma 
digital, pero no constituye el contenido semántico de la experiencia visual 
porque esta información no está digitalizada completamente por la expe- 
riencia sensorial. El contenido semántico de la experiencia sensorial sólo 
puede expresarse mediante un enunciado complejo que describa detalla- 
damente la configuración de la página del periódico. Aunque la experien- 
cia sensorial asociada con la visión de la noticia en el periódico contenga 
la información de que Elmer ha muerto (suponiendo que la noticia del pe- 
riódico lleve esta información), esa experiencia sensorial tiene gran varie- 
dad de conchas informativas más grandes en las que está incrustada tal 
información (acerca de Elmer). Si pensamos que la figura 7-2 es una re- 
presentación de la información que lleva la experiencia sensorial del lector 
del periódico (cuando ve, claro está, las palabras «Elmer ha muerto»), la 
información de que Elmer ha muerto es una de las capas informativas in- 
ternas. La capa externa representa la información altamente específica y 
detallada de la experiencia visual de la página impresa (incluyendo las pa- 
labras «Elmer ha muerto»). Si hemos de tener una estructura con el conte- 
nido semántico de que Elmer ha muerto, esta información debe extraerse 
de la estructura sensorial y digitalizarse completamente. Debe emerger una 
nueva estructura que tenga el hecho de que Elmer muriese como capa in- 
formativa más externa. Por supuesto, esto corresponde a la generación de 
la creencia de que Elmer ha muerto. Es decir, sólo entonces habrá llegado 
el lector a la creencia de que Elmer ha muerto. O, como lo expresamos a 
veces, habrá visto (en el periódico) que Elmer ha muerto. 

Los que no sepan leer, o que no puedan leer el inglés, pueden ver las 
palabras «Elmer ha muerto» en la página del periódico. Pueden, por lo 
tanto, tener la información de que Elmer ha muerto (al estar incluida esta 
información en un estado de cosas que ven). Lo que no podrían hacer es 
digitalizar completamente la información de que Elmer ha muerto cuando 
esta información se presenta en esta forma sensorial. Ver la configuración 
impresa en cuestión no llega a producir una estructura que tenga el hecho 
de que Elmer ha muerto como su contenido semántico. El analfabetismo 
no es una deficiencia perceptiva, sino, más bien, una deficiencia en la co- 
dificación, es decir, una incapacidad para convertir la información pre- 
sente en forma sensorial a una forma cognitiva, una imposibilidad de digi- 
talizar (completamente) la información de que se dispone en la experiencia 
sensorial (en forma analógica) de la página impresa del periódico. 
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Esta es la razón de que los aparatos mecánicos simples (los voltímetros, 
los televisores, los termostatos) no se les pueda atribuir una estructura se- 
mántica (tercer nivel de intencionalidad) con respecto a la información que 
transmiten acerca de una fuente. Continuamente leen, por decirlo así, in- 
formes acerca de una fuente. Por ejemplo, la aguja de un voltímetro lleva 
información sobre el descenso del voltaje en las placas. Si suponemos que 
la información más específica que lleva la aguja acerca del voltaje es que 
es de 7 voltios, entonces la información en cuestión está en forma digital. 
Pero no estará nunca digitalizada completamente. Esta información 
(acerca de la diferencia de potencial entre los conductores) está incluida 
en otras estructuras más «inmediatas» que «lee» la aguja (por ejemplo, la 
cantidad de fluido eléctrico que pasa por el aparato, la cantidad de flujo 
magnético que se genera en el bobinado interno, la cantidad de torsión 
ejercida sobre el inducido móvil). La aguja lleva información sobre el vol- 
taje en virtud de la información precisa y fehaciente que lleva acerca de 
estos sucesos más «inmediatos» (de la misma manera en que nuestra ex- 
periencia sensorial lleva la información de la muerte de Elmer al llevar 
información precisa y fehaciente de la configuración de la tinta en la pá- 
gina del periódico). La posición de la aguja nunca tiene el hecho de que el 
voltaje sea de 7 voltios como su capa informativa más externa. Dada la 
naturaleza de tales aparatos, esta información sobre la fuente está siempre 
incrustada en conchas informativas más grandes que representan el estado 
de los sucesos más «inmediatos» de los cuales depende esta información. 
Básicamente ésta es la causa de que tales aparatos sean incapaces de man- 
tener creencias relativas a los sucesos sobre los que llevan información, 
incapaces, pues, de albergar los estados intencionales de nivel superior que 
nosotros (los usuarios del aparato) podemos llegar a albergar al recoger la 
información que comunican los aparatos. Nosotros, pero no los aparatos, 
tenemos la capacidad de digitalizar completamente la información que 
fluye a través del aparato. Emergen en nosotros, pero no en él, estructuras 
que, como contenido semántico, contienen hechos acerca de una fuente. 

Lo que dota a algunos sistemas de la capacidad de albergar estados que 
contienen, como contenido semántico, hechos acerca de alguna fuente le- 
jana es la plasticidad del sistema para extraer información sobre una fuente 
a partir de toda una variedad de señales físicamente diferentes. El sistema, 
por decirlo así, ignora al mensajero para responder a la información que 
éste proporciona. Si una estructura tiene el hecho de que Elmer ha muerto 
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como contenido semántico, entonces, aun cuando esta estructura particular 
la produzca el ver la noticia —«Elmer ha muerto»— en el periódico, y aun 
cuando éste sea el vehículo por medio del cual llegue esa información, la 
estructura misma no lleva información alguna sobre los medios de su pro- 
ducción (sobre el mensajero). Si la llevara, entonces no sería, contraria- 
mente a la hipótesis, una estructura con el contenido semántico de que El- 
mer ha muerto (puesto que habría una capa informativa mayor, una capa 
que describiría el vehículo de la información, en la que estaría incrustada 
la información sobre Elmer). Si la única manera de producir esta estructura 
(a estructura que tiene el hecho de que Elmer muriera como contenido 
semántico) fuera por medio de una experiencia visual del tipo que la pro- 
dujo (en esta ocasión), entonces la estructura, contrariamente a la hipóte- 
sis, llevaría información sobre sus medios de producción. Llevaría, en par- 
ticular, la información de que el enunciado «Elmer ha muerto» aparecía en 
el periódico. Por lo tanto, es el hecho de que esta estructura pueda ser pro- 
ducida como respuesta a una variedad de señales diferentes lo que explica 
que tenga ese contenido semántico. 

La insensibilidad de una estructura semántica a su origen causal con- 
creto, su silencio sobre la manera concreta en que llegó la información 
(que constituye su contenido semántico), es meramente un reflejo de un 
hecho importante sobre las creencias. Nuestros estados de creencias no dan 
fe por ellos mismos de su origen causal. El hecho de que alguien crea que 
Elmer ha muerto no nos dice nada sobre el modo en que llegó a creer esto, 
cuál fue la causa de que lo creyera. Pudo haberlo leído en el periódico o 
pudo habérselo dicho alguien; pudo haber visto muerto a Elmer o pudo 
haberlo descubierto de alguna manera más indirecta. El hecho de que una 
estructura tenga su capa informativa más externa como contenido semán- 
tico implica que, igual que una creencia, permanece muda acerca de su 
origen causal concreto. Lleva la información, sí, pero no dice nada sobre 
cómo llega esta información. 

Esta plasticidad a la hora de extraer información a partir de una varie- 
dad de señales diferentes, una plasticidad que da cuenta de la capacidad de 
un sistema para generar estados internos que tienen como contenido se- 
mántico información sobre una fuente distante, es una plasticidad de la que 
carece la mayoría de los sistemas que procesan información. La aguja del 
voltímetro lleva información sobre una fuente (la disminución de la dife- 
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rencia de potencial entre los conductores), pero lo hace llevando informa- 
ción precisa y detallada sobre el mensajero (el medio por el que esta infor- 
mación se comunica). La única manera en que puede llegar a la aguja in- 
formación sobre diferencias de potencial es por la vía del fluido eléctrico, 
el campo magnético inducido, la torsión consecuente en el inducido y la 
rotación resultante de inducido y aguja. Ya que, dada la construcción del 
aparato, ésta es la única manera en que la posición de la aguja puede re- 
glstrar el voltaje, la posición de la aguja lleva información sobre todos es- 
tos sucesos intermedios. Puesto que esto es así, la posición de la aguja lleva 
información sobre todos estos sucesos intermedios. Puesto que esto es así, 
la posición de la aguja no tiene, como contenido semántico, el hecho de 
que el voltaje sea tal o cual. No puede digitalizar completamente esta in- 
formación.!* 

Con la idea de contenido semántico de una estructura estamos, final- 
mente, en posición de dar una explicación de la creencia. Aunque no po- 
demos sencillamente identificar una creencia, la creencia, pongamos por 
ejemplo, de que t es F, con una estructura que tenga £ es F como contenido 
semántico, estamos realmente a poca distancia de nuestro objetivo. En la 





144 Aparatos sencillos que procesan información como los que se han descrito (voltímetros, 
termostatos y receptores de televisión), no sólo no digitalizan completamente la información 
de una fuente (con la palabra «fuente» me refiero aquí al estado de cosas del cual nosotros, 
los usuarios del aparato, obtenemos típicamente información usando ese aparato), sino que 
tampoco digitalizan completamente ninguna información. Las estructuras de tales aparatos 
que llevan información no tienen contenido semántico porque, normalmente, no tienen nin- 
guna capa informativa más externa. 

Estas estructuras llevan información acerca de estados de cosas que son anteriores, pero 
cada información que lleva la estructura está incluida, como si fueran cajas chinas, en una 
capa informativa aún más grande. La ordenación de estas capas informativas es como el con- 
junto de los números reales menores que 1. Para cada número menor que 1 hay siempre uno 
mayor que es todavía menor que 1. Para cada estado de cosas distinto de la estructura misma, 
la estructura llevará información sobre ese estado de cosas sólo en la medida en que lleva 
información acerca de algunos estados de cosas intermedios. Por supuesto, esto es meramente 
un reflejo del hecho de que tal información se comunica por medios causales, y no hay ma- 
nera de pararse (a no ser en el propio efecto) y especificar el antecedente causal más cercano, 
o más inmediato. Los sistemas cognitivos genuinos tienen la misma continuidad en los pro- 
cesos causales por medio de los que se produce una estructura semántica, pero (como vimos 
en el capítulo 6, especialmente en la figura 6.2) las estructuras producidas de ese modo no 
llevan información acerca de sus predecesores causales inmediatos. Representan la fuente sin 
representar los sucesos inmediatos por medio de los que se transmite la información sobre la 
fuente. 
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idea de una estructura semántica tenemos ya algo con el nivel apropiado 
de intencionalidad. Lo que queda por hacer es mostrar el modo en que tales 
estructuras llegan a producir algo que posea toda la serie de propiedades 
que asociamos con las creencias. Este es el propósito del próximo capítulo. 


DS 
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S. La estructura de la creencia 


El contenido semántico de una estructura ha sido identificado con la 
información que lleva en forma completamente digitalizada. Así, puesto 
que la información que lleva una estructura no puede ser falsa, el contenido 
semántico de una estructura tampoco puede ser falso. Pero desde luego 
podemos tener creencias falsas. Por ello, las creencias no son estructuras 
semánticas —al menos no lo son si ello requiere que se identifique el con- 
tenido de la creencia (lo que se cree con el contenido semántico de la es- 
tructura. 

Claro está que puede haber algunas creencias que se autogaranticen, 
creencias que no pueden ser falsas dada la naturaleza de su contenido, pero 
de ninguna manera queremos conseguir una explicación de la creencia que 
haga imposible que cualquier creencia sea falsa. Pretendemos que nuestra 
explicación abarque ambos tipos de creencias, la creencia de que tenemos 
creencias y la creencia de que tendremos un tiempo soleado cuando ma- 
ñana vayamos a comer al campo. Por esta razón lo análogo a una creencia 
cuando nos basamos en la teoría de la información debe ser capaz de tener 
un contenido falso. Debe, en relación a las cosas de que habla, ser capaz 
de representar erróneamente cómo son estas cosas. 

Puede ser útil que ahora nos fijemos en algunos instrumentos de repre- 
sentación, como, por ejemplo, mapas, diagramas y cartas de navegación. 
¿Cómo es posible que las líneas de colores, los puntos y las áreas dibujadas 
en un papel puedan representar erróneamente ciertas características de la 
geografía de una zona? ¿Qué es lo que permite que el mapa diga, con ver- 
dad o falsedad, según el caso, que hay un parque ahí y un lago más allá? 
Parece razonablemente claro que el poder de estos símbolos cartográficos 
para representar, y para describir de manera falsa, la geografía de una zona 
depende, fundamentalmente, de su papel como portadores de información. 
Estos símbolos se usan para transmitir información sobre la localización 
de calles, parques y puntos de interés de una ciudad. Lo que hace que el 
mapa sea un recurso convencional es que los símbolos son más o menos 
arbitrarios (cierta masa de agua podría ser representada por tinta de color 
rojo en vez de tinta de color azul); de ahí que su capacidad como portado- 
res de información deba ser garantizada por las intenciones, la integridad 
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y la fidelidad en la realización de aquellas personas que elaboran los ma- 
pas. Un eslabón crucial en el flujo de la información (que va desde el te- 
rreno físico hasta la disposición de las marcas sobre el papel) es la persona 
misma que hace el mapa. Es un eslabón de la cadena de comunicación en 
el que puede perderse la información a causa de la ignorancia, el descuido 
o el engaño. A no ser que este eslabón sea firme, a menos que sea un esla- 
bón por el cual pueda pasar la información acerca de la geografía de una 
zona (y por el que normalmente pase), el mapa no representará, ni siquiera 
representará erróneamente, la situación y orientación de calles, parques, 
etc. A no ser que asumamos que la configuración de las marcas sobre el 
papel sean, al menos en las condiciones óptimas, un proveedor de infor- 
mación acerca de la geografía de una zona, el mapa resultante es algo que 
no tiene poder para representar, ni tampoco para representar erróneamente 
cómo son las cosas. No puede decir ni lo falso ni lo verdadero, porque no 
puede decir nada en absoluto. 

Si dos barajas se barajan independientemente, la ordenación resultante 
de las cartas en la primera baraja no representa ni representa erróneamente 
la ordenación resultante de las cartas en la segunda. Incluso si el rey de 
tréboles aparece (por pura casualidad) como primera carta de ambas bara- 
jas, su aparición al comienzo de la primera baraja no representa nada en 
relación con su situación en la segunda baraja. No «dice» que el rey de 
tréboles está al inicio de la segunda baraja. Sin embargo, si suponemos que 
existe un mecanismo para hacer que el rey de tréboles quede como primera 
carta de la segunda baraja siempre que una carta de color negro, por ejem- 
plo, aparezca al comienzo de la primera, entonces una carta de color negro 
al comienzo de la primera baraja sí diría algo. Diría que el rey de tréboles 
era la primera carta de la segunda baraja, aun cuando un fallo del meca- 
nismo hiciera que la sota de corazones estuviese allí. 

De igual modo, si la aparición de las diferentes líneas, puntos y espa- 
cios coloreados de un mapa estuviera respecto a la geografía de una ciudad 
en la misma relación en que una baraja de cartas bien barajadas lo está con 
otra baraja, entonces, por muy fielmente que se correspondiera el «mapa» 
(dadas las convenciones cartográficas usuales) con la ubicación de las ca- 
lles y los parques de la ciudad, no representaría, ni siquiera representaría 
erróneamente, los lugares en que se encuentran. El mapa no podría «decir» 
que hay un lago en el parque, y menos aún decirlo con verdad, porque no 
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habría ningún mecanismo que incrustara esta información en la configura- 
ción de las señales en el papel. Los recursos expresivos de nuestra primera 
baraja están limitados por la clase de información que puede llevar sobre 
la disposición de las cartas en la segunda baraja. De forma similar, el poder 
expresivo de un mapa, y de ahí su capacidad para representar errónea- 
mente cómo son las cosas, está circunscrito, en condiciones normales, a 
los tipos de información que lleva acerca del terreno que aquél está desti- 
nado a representar. Esta es la razón de que una línea serpenteante de color 
azul en el mapa no representa erróneamente el color del agua. En las con- 
venciones normales para la confección de mapas no es ésta la clase de 
información que está destinado a llevar el color de la línea. 

¿Qué podemos, entonces, aprender de esta breve digresión sobre el po- 
der de representación de los mapas? ¿Nos ayuda a comprender la manera 
en que una estructura semántica podría llegar a representar erróneamente 
un estado de cosas? 

Recordemos, un mapa puede representar erróneamente la geografía de 
una zona sólo en la medida en que se entienda que sus elementos (las di- 
versas señales de color) tienen un significado independiente del acierto 
con que lleven la información en una determinada ocasión. Una configu- 
ración determinada de señales puede decir (significar) que hay un lago en 
el parque sin que en realidad haya un lago en el parque (sin llevar real- 
mente esta información) porque esta configuración particular de señales es 
un ejemplar (espécimen) de un tipo general de configuración que sí tiene 
esta función de llevar información. El símbolo-ejemplar hereda su signifi- 
cado del símbolo-tipo del cual es un espécimen; y el símbolo-tipo desem- 
peña un papel de portador de información independientemente del acierto 
(si lo hubiera) de sus ejemplares en llevar esta información. En el caso de 
un símbolo cartográfico (y otros vehículos convencionales de la comuni- 
cación), son quienes elaboran el mapa los que normalmente asignan este 
papel de portador de información al símbolo-tipo. El mapa está provisto 
de una clave que distribuye los papeles de portadores de información entre 
los diferentes símbolos-tipos, y esto es compatible con que ejemplares 
concretos de aquellos tipos fallen a la hora de desempeñar el papel que se 
les ha asignado; es decir, fallen a la hora de llevar la información que tie- 
nen la función de comunicar. Lo que hace posible que un mapa represente 
erróneamente las cosas es esto: un símbolo- espécimen falla a la hora de 
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llevar la información que tiene la misión de transmitir en virtud el tipo del 
cual aquél es un ejemplar. 

¿Pero qué es lo que funciona como clave en el caso de las estructuras 
neurológicas que pretendemos identificar con las creencias de organismos 
vivos? ¿Quién o qué asigna los significados, o los papeles de portadores 
de información, a estas estructuras? 

Supongamos que durante el período L un sistema está expuesto a una 
variedad de señales, algunas de las cuales contienen la información de que 
ciertas cosas son FF, y otras la información de que otras cosas no son F. El 
sistema es capaz de recoger y codificar esta información en forma analó- 
gica (es decir, dándole una representación perceptiva), pero es incapaz de 
digitalizar esta información al comienzo del período L. Supongamos, ade- 
más, que durante L el sistema desarrolla una manera de digitalizar la in- 
formación de que algo es F: se desarrolla un cierto tipo de estado interno 
que es sensible de un modo selectivo a la información de que s es F. Esta 
estructura semántica se desarrolla durante el período L como respuesta a 
toda una serie de señales portadoras de información (ayudada, probable- 
mente, por algún tipo de entrenamiento o refuerzo). Una vez que esta es- 
tructura está desarrollada, adquiere vida propia, por así decir, y es capaz 
de conferir a sus ejemplares subsiguientes (ejemplos concretos de esa es- 
tructura-tipo) su contenido semántico (el contenido que adquiere durante 
el período L) tanto si estos ejemplares subsiguientes tienen como conte- 
nido informativo ese contenido como si no lo tienen. En resumen, la es- 
tructura-tipo adquiere su significado de la clase de información que llevó 
a su desarrollo como estructura cognitiva.!* Los especímenes subsiguien- 
tes de esta estructura-tipo adquieren su significado del tipo del cual son 
ejemplares. Lo que esto significa, por supuesto, es que los ejemplares sub- 
siguientes de esta estructura tipo pueden significar que s es F, es decir, 
pueden tener este contenido proposicional, a pesar del hecho de que fallen 
a la hora de llevar esta información, es decir, o pesar del hecho de que s 
(lo que suscita su aparición) no sea F. El significado de una estructura se 
deriva de los orígenes informativos de esa estructura, pero una estructura- 
tipo puede tener su origen en la información acerca de la F-idad de las 





145 Aproximadamente, una estructura cognitiva es un estructura semántica cuyo contenido 
(semántico) ejerce algún control sobre la conducta (output). Volveré luego sobre este punto. 
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cosas sin que cada espécimen subsiguiente de tal tipo (o incluso ninguno) 
tenga esta información como origen. !*$ 

Lo que acabo de describir, en términos de la teoría de la información, 
es un caso simple de formación de conceptos.!'* Lo típico es que uno 
aprenda el concepto F, es decir, que aprenda lo que es un F, al verse ex- 
puesto (en la situación de aprendizaje: L) a toda una variedad de cosas, 
algunas de las cuales son F y otras no. No sólo se está frente a cosas que 
son F y frente a otras que no lo son, sino que el hecho de que unas lo son 
y otras no, se hace obvio o evidente en la percepción. Dicho de otro modo, 
la situación de aprendizaje es una situación en la que la información de 
que algo es F (o no F según el caso) se pone a disposición del sujeto a fin 
de configurar sus respuestas de tipo discriminatorio y de identificación. Lo 
que se forma cuando uno aprende lo que es un F, al menos en los casos 
simples de ostensión de que ahora tratamos, es una estructura interna que 
es sensible de modo selectivo a la información sobre la F-idad de las cosas. 
Desarrollar tal estructura semántica interna es adquirir un concepto simple: 
un concepto que corresponde al contenido semántico de la estructura así 
desarrollada. 

Para enseñarle a alguien el concepto rojo, le mostramos al alumno va- 
rios objetos de color a razonable distancia y con iluminación normal. Esto 
es, exhibimos los objetos de color en condiciones en las que se transmite 
información sobre su color, se recibe y (con optimismo se espera que) se 
codifica preceptivamente. Esta es la razón de que no podamos señalarle a 
alguien los colores si ponemos los objetos de color a 400 metros de dis- 
tancia; aun cuando el sujeto pudiera ver los objetos de color, la informa- 
ción sobre sus colores no es asequible (o puede no serlo). Por la misma 





146 A partir de ahora, el contenido de una estructura -tipo se expresará con un enunciado 
abierto (por ejemplo, «x es F») y el contenido de sus ejemplares con un enunciado cerrado 
en el que una constante (s, con la que aludimos a la fuente y con la que designamos el objeto 
perceptivo) reemplaza la variable x. Esto refleja el hecho de que las dos clases de estructuras 
—la estructura-tipo y la estructura-espécimen— tienen significado, y sólo los especímenes 
valor de verdad. Esta es la diferencia entre el concepto F y una creencia (de re) de que algo 
es F. 


147 No se pretende que esto sea una explicación general del aprendizaje (de los conceptos). 
Lo que se ha descrito es la adquisición de un concepto simple de manera ostensiva sencilla. 
En el capítulo 9 se hablará algo más de los contrastes que hay entre los conceptos simples y 
los complejos, entre los conceptos innatos y los adquiridos. 
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razón tampoco funcionaría este método con los daltónicos; no podemos 
hacer que entre la información. Por ello tampoco llevamos a cabo tal en- 
trenamiento en la oscuridad o con iluminación deficiente. (En el próximo 
capítulo analizo la posibilidad de enseñar a alguien los conceptos de color 
en condiciones deficientes de iluminación.) Si el sujeto ha de adquirir el 
concepto rojo, no sólo se le deben enseñar cosas rojas (y, probablemente, 
cosas que no sean rojas), se le debe permitir que reciba la información de 
que son rojas (y no rojas). La razón por la que se hace esto es clara: es la 
información de que el objeto es rojo lo que se necesita para configurar la 
estructura interna que finalmente constituirá el concepto rojo del sujeto. 
Necesitamos información para fabricar el significado (el concepto) porque 
para que cristalice un tipo de estructura con el contenido semántico apro- 
piado se requiere información. 

En la situación de aprendizaje se tiene especial cuidado en hacer que 
las nuevas señales tengan una intensidad o una fuerza suficiente como para 
comunicar la información requerida al sujeto que está aprendiendo. Si la 
luz es demasiado débil, se encienden otras. Si los objetos (aquellos que son 
F y aquellos que no lo son) están demasiado lejos, se traen más cerca. Si 
el sujeto necesita gafas, se le proporcionan. Se toman tales precauciones 
en la situación de aprendizaje (durante L) para asegurarse de que se desa- 
rrolle una estructura interna con el contenido semántico apropiado, es de- 
cir, una estructura interna que constituya una digitalización (completa) de 
la información de que s es F. Si la información de que s es F se pierde, 
entonces, obviamente, no puede producirse ninguna estructura interna con 
el contenido semántico apropiado (de que x es FF). 

Pero una vez que tenemos el significado, una vez que el sujeto ha arti- 
culado una estructura que es sensible de modo selectivo a la información 
sobre la F-idad de las cosas, se pueden provocar ejemplos de esa estruc- 
tura, especímenes de ese tipo, por medio de señales que carecen de la in- 
formación apropiada. Cuando esto ocurre, el sujeto cree que s es F, pero, 
debido a que tal ejemplar de la estructura-tipo no fue producido por la in- 
formación de que s es F, el sujeto no sabe que s es F. Y si, en efecto, s no 
es F, el sujeto cree falsamente que s es F. Tenemos un caso de representa- 
ción errónea, un ejemplar de una estructura con un contenido falso. En una 
palabra, tenemos significado sin verdad. 
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Podemos ver cómo funciona este proceso en casos simples de adquisi- 
ción de conceptos. Durante el aprendizaje el sujeto desarrolla una sensibi- 
lidad selectiva a ciertas clases de información. Hasta que el alumno no sea 
capaz de mostrar una pauta de respuestas discriminatorias que sean sinto- 
máticas del nivel apropiado de digitalización, nos negamos a atribuirle do- 
mino del concepto. Y cuál sea el concepto que le atribuyamos al sujeto es 
una función de la información que creamos que hizo que se formara la 
estructura interna adecuada (es decir, está en función de cuál sea la estruc- 
tura semántica que se haya desarrollado realmente). Por ejemplo, consi- 
dérese a una niña a la que se enseña a reconocer e identificar pájaros. Se 
le muestra a poca distancia un cierto número de petirrojos, de tal manera 
que sus rasgos distintivos y siluetas sean claramente visibles. Se le ponen 
también, como contraste, unos cuantos azulejos.!* Se la estimula a decir 
«petirrojo» para referirse a los petirrojos y «no petirrojo» para referirse a 
todos los demás (los azulejos). Después de un período de entrenamiento 
satisfactorio la niña descubre un gorrión en un árbol cercano, señala hacia 
él entusiasmado y dice «petirrojo». Por supuesto, lo que la niña dice es 
falso. El pájaro no es un petirrojo. Pero ahora no estamos interesados en 
evaluar la verdad o falsedad de lo que la niña dice, sino más bien en la 
verdad o falsedad de lo que cree. Para determinar esto tenemos que saber 
lo que la niña cree, y no es del todo claro que la niña esté expresando 
apropiadamente lo que cree cuando pronuncia la palabra «petirrojo». 

¿Cree la niña que el pájaro (el gorrión) sea un petirrojo? ¿O cree, qui- 
zás, simplemente que es un pájaro pardo de algún tipo (un pájaro no azul)? 
Dada la limitada gama de contrastes a los que se ha expuesto a la niña 
durante su entrenamiento (sólo azulejos), no es nada claro cuál era la in- 
formación a la que estaba respondiendo cuando acertó en la identificación 
de todos los petirrojos de la muestra. Por tanto, no está nada claro cuál es 
el concepto que expresa con la palabra «petirrojo» y cuál es la creencia 
que tiene cuando señala al gorrión y dice «petirrojo». Si, contrariamente a 
lo que cabría esperar (dado lo restringido de las condiciones del aprendi- 
zaje), la niña desarrolla realmente una estructura interna con el contenido 





148 Nota del traductor. Los azulejos son ciertos pájaros llamados así por el plumaje azul que 
presentan en todo el cuerpo o en partes del mismo. 
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semántico: x es un petirrojo,!*” si ésta fue la información a la que se hizo 
sensible de manera selectiva durante el período de entrenamiento (y lo que 
explicaba su acierto inicial en distinguir los petirrojos de los azulejos de la 
muestra), entonces la creencia que expresa la niña cuando señala al gorrión 
y dice «petirrojo» es una creencia falsa. En efecto, la niña cree que el pá- 
jaro es un petirrojo, es decir, el estímulo actual produce un espécimen de 
una estructura-tipo que tiene el contenido semántico «x es un petirrojo» 
con respecto a un s (el gorrión) que no es un petirrojo, y esta creencia es 
falsa. Por otra parte, si la niña estaba respondiendo (durante el entrena- 
miento) sólo al color de los pájaros, llamando «petirrojos» a aquellos que 
no eran azules, entonces la creencia de la niña cuando dice «petirrojo» 
mientras señala al gorrión es verdadera, pues lo que cree es que el pájaro 
no es azul, y esto es verdad. 

Este ejemplo pretende ilustrar la forma en que están relacionados con- 
ceptos, creencias y estructuras semánticas. En el próximo capítulo se dirá 
algo más sobre la naturaleza de los conceptos. Por el momento basta darse 
cuenta de que ahora tenemos, en la idea de una estructura semántica, y en 
la distinción entre una estructura- tipo y una estructura-espécimen, recur- 
sos para analizar las creencias y sus conceptos asociados que se basan en 
una teoría de la información. Como hemos visto (capítulo 7), una estruc- 
tura semántica tiene un contenido más o menos único, un contenido con 
un grado de intencionalidad comparable al de una creencia. Así pues, al 
identificar las creencias con los ejemplares concretos (especímenes) de 
estas estructuras semánticas abstractas, resolvemos el problema con el que 
empezó este capítulo, el problema de explicar (en términos de estructuras 
informativas) la posible falsedad de las creencias, el problema de la repre- 
sentación errónea. La manera de resolver este problema estriba en darse 





149 En este estadio del proceso sería prematuro, quizás, atribuir a la niña el concepto peti- 
rrojo. Podríamos preferir decir que tiene un concepto visual de un petirrojo. Esta manera de 
expresar el logro conceptual de la niña es una forma de reconocer el hecho de que hasta este 
momento (dadas las restringidas condiciones del aprendizaje) no se ha formado estructura 
alguna con el contenido semántico «x es un petirrojo». Lo que se ha formado es una estructura 
que es (a lo sumo) sensible de forma selectiva a la información de que s es un petirrojo cuando 
esta información se transmite en forma visual. Por ello, la estructura resultante lleva alguna 
información relativa a los medios por los que se transmitió la información (de que s es un 
petirrojo) y, por lo tanto, no constituye una digitalización completa de la información de que 
ses un petirrojo. 
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cuenta de que un fipo de estructura (un concepto) puede tener orígenes 
informativos (en el sentido de que ese tipo de estructura se desarrolló 
como el modo que un sistema tiene de codificar ciertas clases de informa- 
ción) sin que los ejemplares (subsiguientes) de aquella estructura tengan 
orígenes informativos similares. 

Hay, sin embargo, otra dimensión de las creencias, una dimensión dis- 
tinta de su estructura intencional y, sin embargo, relacionada con ella. D. 
M. Armstrong, siguiendo a F. P. Ramsey, considera que la creencia es una 
especie de mapa (interno) por medio del cual nos guiamos.'*% Por supuesto, 
esto no es más que una metáfora sugerente, pero refleja dos propiedades 
de las que comúnmente se piensa que son esenciales en la idea de creencia: 
1) la idea de una estructura con poder representativo (de ahí lo de mapa), 
y 2) la idea de una estructura que tiene algún control sobre la conducta de 
un sistema del cual forma parte (de ahí lo de que es algo con lo que nos 
guiamos). Hasta este momento nos hemos concentrado exclusivamente en 
el primer aspecto de la creencia. Yo sugiero que la idea de estructura se- 
mántica capta todo lo que tiene de valioso la metáfora de la creencia como 
mapa. Del mismo modo que un mapa representa ciertas características 
geográficas de una zona, un ejemplo determinado de una estructura se- 
mántica representa (o representa erróneamente, según sea el caso) la forma 
en que las cosas son con respecto a una fuente dada. Pero debemos también 
tener en cuenta la segunda propiedad de las creencias, el hecho de que 
estas estructuras, para poder ser calificadas de creencias, deben configurar 
O ser capaces de configurar la conducta del sistema del cual forman parte. 

Consideremos, por ejemplo, un termostato corriente de uso casero. 
Este aparato tiene una lámina interna compuesta de dos metales que regis- 
tra la temperatura del ambiente por su grado de curvatura. El estado físico 
de este componente desempeña un papel en el funcionamiento de todo el 
sistema. Lo que el termostato haga depende, en parte al menos, de lo que 
ese componente haga. Cuando la lámina de metal se curva lo suficiente 
como para tocar un contacto regulable (regulable para que así se corres- 
ponda con la temperatura que se desea que tenga el ambiente), se cierra un 
circuito eléctrico y se envía una señal a la caldera. En términos de la teoría 
de la información, la lámina de metal es un detector de temperatura: su 





159 D, M. Armstrong, Belief, Truth and Knowledge, Cambridge University Press, Cam- 
bridge, 1973, primera parte (especialmente el capítulo 1). 
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curvatura depende de la temperatura ambiental, y lleva información acerca 
de ella. Las respuestas del termostato (el envío de una señal a la caldera) 
están controladas por este detector. Sin embargo, si quitamos mecánica- 
mente el contacto regulable, de manera que no pueda haber ningún con- 
tacto eléctrico, no importa cuánto se curve la lámina de metal en respuesta 
al cambio de temperatura, el termostato se transforma entonces en algo sin 
vida. No enviará ninguna señal a la caldera. En un caso como el que esta- 
mos explicando la información sobre la temperatura ambiental seguirá lle- 
gando al termostato. Este seguirá «sintiendo» la bajada de la temperatura 
ambiental (su componente detector de temperatura llevará todavía esta in- 
formación). A pesar de ello, este estado informativo ha perdido su signifi- 
cación funcional para el sistema en su totalidad. La información que se 
expresa en la curvatura de la lámina de metal no tiene ahora poder para 
influir en el rendimiento del termostato mismo. Nosotros continuamos te- 
niendo un «mapa» interno, pero éste ya no tiene el control del timón. 

Una creencia es como la configuración de la lámina de metal en un 
termostato que funciona correctamente: es un estado interno que no sólo 
representa su entorno sino que también funciona como un determinante de 
la respuesta del sistema a ese entorno.!*! Las creencias son estructuras se- 
mánticas, pero no es eso todo lo que son. Son estructuras semánticas que 
ocupan un cargo ejecutivo en la organización funcional de un sistema. 
Hasta que una estructura no ocupa este cargo ejecutivo, no podemos decir 
que constituya una creencia. A partir de ahora, a las estructuras semánticas 
que tienen una función ejecutiva, que ayudan a configurar la respuesta de 
un sistema, las llamaremos estructuras cognitivas. 

Todo esto no quiere decir que una estructura cognitiva deba en realidad 
determinar paralelamente alguna conducta. Ni siquiera significa que la es- 
tructura cognitiva deba algunas veces determinar alguna conducta. La in- 
formación (o presunta información) que constituye el contenido semántico 
de una estructura puede sencillamente archivarse para su uso posterior; es 
decir, almacenarse en alguna forma asequible para determinar en el futuro 





151 Esta comparación se debería entender solamente como una analogía. Los termostatos, 
incluso los que funcionan correctamente, no tienen creencias. La razón de ello no es que les 
falten estados internos con contenido informativo, tampoco es que estos estados internos no 
influyan en la respuesta (output), sino que —como se indicó en el capítulo 7— estos estados 
internos no tienen el contenido semántico apropiado. 
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una conducta. Se trata, por supuesto, de la memoria, un gran tema del que 
tengo muy poco que decir. Sin embargo, espero que lo que diga sobre las 
estructuras cognitivas que subyacen al conocimiento y a la creencia pueda 
producir, de forma bastante natural, una explicación de la memoria en tér- 
minos similares. 

Cuando hablo de una estructura semántica que determina la conducta, 
quiero decir que la información (nuestra presunta información)!” que 
constituye el contenido semántico de esa estructura es un determinante 
causal de la conducta. Ya he explicado (capítulo 4) lo que se quiere decir 
con que-algo ocurra, a saber: la información (presente en una señal o una 
estructura S) es causa de £ en la medida en que las propiedades de S que 
llevan esta información sean aquellas cuya posesión (por S) la hacen causa 
de E. Así, por ejemplo, si S lleva la información de que s es F, y esta in- 
formación la lleva porque S tiene la propiedad G, entonces podemos decir 
que si el que $ sea G causa E, la información de que s es F' causa E. Si una 
estructura tiene el contenido semántico m, entonces m causa E en la me- 
dida en que las propiedades de S que le dan este contenido sean las respon- 
sables de que S cause E. 

Este punto es importante porque es precisamente el contenido de nues- 
tras creencias, es decir, lo que creemos, aquello que configura nuestra con- 
ducta (lo que hacemos), y pretendemos que este hecho se refleje en la efi- 
cacia causal de las estructuras semánticas. Una estructura semántica se ca- 
lifica de estructura cognitiva (y por tanto, como argumentaremos, de 
creencia) en tanto que su contenido semántico sea un determinante causal 
de la conducta del sistema en el cual se da. Por supuesto, es posible que 
una estructura sea eficaz causalmente en virtud de propiedades no relacio- 
nadas con el hecho de que tenga el contenido semántico particular que 





152 Después de que una estructura semántica se haya desarrollado (como respuesta selectiva 
de un sistema a una información), puede, por supuesto, ejemplificarse en respuesta a una 
señal que carece de la información pertinente (la información que corresponda al contenido 
semántico de la estructura). En este caso, aunque la estructura signifique que s es F —en el 
sentido de que un espécimen determinado es un ejemplar de una estructura-tipo con ese con- 
tenido semántico—, el espécimen mismo no lleva tal información. Sólo es una presunta in- 
formación, o bien, como a veces diré, el significado de la estructura-espécimen. De aquí en 
adelante, cuando se hable del contenido semántico de una estructura (espécimen), me referiré 
al contenido que hereda del tipo de estructura de la que es un ejemplar, es decir, su signifi- 
cado. 
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efectivamente tiene. Si, por ejemplo, le digo a alguien —con una seña de 
la mano acordada previamente— que me dispongo a partir, mi gesto causa 
que esa persona crea que me dispongo a partir. Pero puede también espan- 
tar una mosca. Presumiblemente es la información de que me dispongo a 
partir lo que causa que esa persona crea lo que cree, pero no es esta infor- 
mación lo que espanta a la mosca. El gesto es la causa en ambos casos, 
pero en cada caso la eficacia causal se debe a diferentes características del 
gesto. Rascar mi nariz habría asustado a la mosca, pero no le habría dicho 
a esa persona que me disponía a partir. Si fue la información de que me 
disponía a partir la causa de que creyera que me disponía a partir o no fue 
esa información la causa, depende de si fueron las propiedades del gesto 
que llevaban tal información las que causaron la creencia. 

Así pues, para que un estado interno pueda calificarse de estructura 
cognitiva no sólo debe tener un contenido semántico, sino que debe ser 
este contenido lo que defina la influencia causal de la estructura sobre la 
conducta. Sólo entonces podemos decir que el sistema hace A porque al- 
berga un estado interno con el contenido de que s es F, es decir, porque 
cree (o sabe) que s es F. 

Esta cuestión es también para entender por qué algunas estructuras se- 
mánticas, aunque sean —en cierto modo— eficaces causalmente en el con- 
trol de la conducta, no puedan calificarse de creencias. No se califican de 
creencias, es decir, de estructuras que tienen un contenido cognitivo, por- 
que no es su contenido semántico lo que determina la conducta. Por ejem- 
plo, uno oye describir ciertas células neuronales —o bien ciertas redes de 
neuronas— como detectores de bordes, detectores de movimiento o detec- 
tores de gradientes. La palabra «detector» en este contexto puede sugerir 
que estas células o redes constituyen estructuras cognitivas (proto-creen- 
cias) con un contenido que se corresponde con la característica detectada 
(por ejemplo, que s es un borde o que s es un movimiento). Según esto, el 
sujeto sólo cree (conscientemente), por ejemplo, que está pasando un ca- 
mión, pero su sistema nervioso está completamente lleno de multitud de 
creencias más simples con las cuales se construye esa creencia de nivel 
superior relativa al camión. Todo el proceso empieza a parecerse a una 
inferencia inductiva compleja —ya menudo se lo describe así—, en la que 
la creencia final, la que se tiene conscientemente, es la culminación de un 
proceso computacional —proceso en el que se incluyen la formación y la 
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comprobación de hipótesis— que comienza con creencias simples sobre 
líneas, colores, movimientos, texturas y ángulos.!** 

Pienso que esto es una equivocación, equivocación que se alimenta de 
la confusión entre estructuras portadoras de información, por una parte, y 
estructuras cognitivas genuinas, por otra. Aun cuando concedamos que 
aquellos procesos neuronales preliminares tengan un contenido semántico, 
esto, por sí mismo, no permite atribuirles un status cognitivo. En efecto, a 
no ser que estas estructura semánticas preliminares controlen el timón, es 
decir, a menos que su contenido semántico sea un determinante de la con- 
ducta del sistema (en cuyo caso, naturalmente, el sistema permitirá atri- 
buirle la creencia de que había un borde aquí, un ángulo allá, un gradiente 
de brillo a la izquierda, etc.), tales estructuras no tienen un contenido cog- 
nitivo por sí mismas. La información relativa a ángulos, líneas y gradientes 
se usa, obviamente, en la producción de una creencia perceptiva (por ejem- 
plo, que está pasando un camión), pero esta información se elimina (o 
puede eliminarse) de forma sistemática en el proceso de digitalización por 
el cual se sintetiza finalmente una estructura semántica. Una estructura que 
tenga el contenido semántico «s es un camión» no puede llevar informa- 
ción sobre el proceso neuronal que condujo (causalmente) a su formación. 
Si ello ocurriera, entonces (contrariamente a la hipótesis) no constituiría 
una digitalización completa de la información de que s era un camión. No 
sería, por tanto, una estructura con ese contenido semántico. Por ello, 
puesto que la información de estos procesos preliminares puede no estar 
disponible en la estructura final, la que determina la conducta, el contenido 
semántico de estos procesos preliminares puede no ejercer control alguno 
sobre el rendimiento. En tales casos no tienen el status cognitivo. No puede 
calificárselos de creencias. 





153 Un enfoque parecido a éste se presenta en The Language of Thought de Jerry Fodor 
(Nueva York, 1975). Sin embargo, no me parece claro que Fodor quiera describir estos pro- 
cesos preliminares (detección de características) en términos cognitivos (como creencias, jui- 
cios o cualquier otra cosa). Describe todo el proceso perceptivo-cognitivo como de carácter 
inferencial (en términos de la formación y contrastación de hipótesis), y esto sugiere cierta- 
mente que concibe los «datos» suministrados por esos detectores de características como algo 
que se da en una cierta forma (como la creencia o el juicio) a partir de la cual pueden hacerse 
inferencias. Con todo, puede que lo que se pretenda es que esta terminología constituya una 
mera incrustación raciomórfica en un proceso especialmente no cognitivo. 
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Compárese el caso anterior con el de un mecanismo de reconocimiento 
de configuraciones, capaz de reconocer las configuraciones de tipo T en 
cualquier orientación. Tal mecanismo puede usar información sobre la 
orientación de una determinada configuración para llegar a identificarla 
como configuración del tipo T (por medio de, supongamos, una etiqueta 
diferenciadora). Pero la etiqueta no llevará información sobre la orienta- 
ción peculiar de la configuración que está siendo reconocida. Si lo hiciera, 
entonces el mecanismo sería incapaz (contrariamente a la hipótesis) de re- 
conocer el mismo modelo en orientaciones diferentes (puesto que configu- 
raciones del tipo T orientadas diferentemente no producirían el mismo re- 
sultado). Puede utilizarse información sobre la orientación para conseguir 
la identificación, pero puede que no haya información disponible (sobre la 
orientación) en el estado que constituye la identificación del sistema. 

Ésta es también la razón de que nuestra experiencia sensorial, la expe- 
riencia asociada, por ejemplo, con el ver pasar un camión, no constituya 
una estructura cognitiva. Es verdad que tiene un contenido semántico — 
que se puede expresar en un enunciado complejo que describa toda la in- 
formación que lleva la experiencia visual—, pero este contenido semán- 
tico no ejerce ningún control sobre la conducta. Lo que determina la con- 
ducta es una estructura que tenga como capa informativa más externa (con- 
tenido semántico) la misma información que lleva la experiencia sensorial 
en forma analógica (como una capa informativa interior). Hasta que no se 
produce la digitalización, no aparece nada que tenga significación cogni- 
tiva, y una vez que se produce la digitalización, desaparece el contenido 
semántico de los estados (causalmente) antecedentes (incluyendo la expe- 
riencia sensorial). 

Esta explicación de la creencia, aunque sea todavía un esbozo, '** tiene 
un carácter etiológico. Es decir, un cierto tipo de estructura adquiere su 
contenido, la clase de contenido que asociamos con las creencias por sus 
orígenes informativos. Se desarrolla (durante el aprendizaje) una estruc- 
tura interna, que es la forma del sistema de digitalizar completamente la 
información acerca de, por ejemplo, la F-idad de las cosas. Esta manera de 





154 «Esbozo» porque sólo estamos considerando todavía la clase de creencia más simple, la 
más primitiva: una creencia de re de la forma «Esto es F» que implica un concepto simple F 
adquirido perceptivamente. En el próximo capítulo volveré sobre estos puntos y sugeriré que 
el análisis no es tan restringido como ahora podría parecer. 
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codificar la información (como el contenido semántico de la estructura que 
determina la conducta) hace que la información codificada de ese modo 
sea pertinente para explicar la conducta del sistema. Es este origen lo que 
define el contenido o significado de las estructuras internas. Define lo que 
un sistema cree cuando una de estas estructuras se ejemplifica posterior- 
mente en relación con algún objeto perceptivo. El que un sistema crea algo 
depende, parcialmente, de los efectos (sobre la conducta del sistema) de 
tales estados internos, puesto que para que pueda decirse que una estruc- 
tura interna tiene contenido cognitivo debe tener responsabilidades ejecu- 
tivas. Pero el contenido se determina únicamente por el origen de la es- 
tructura: por su herencia informativa. 

Esto no quiere decir que la conducta pueda ser dejada de lado. Todo lo 
contrario: con fines epistemológicos el carácter de la conducta (su conve- 
niencia, franqueza y resolución) suministra datos, y frecuentemente los 
únicos datos disponibles, para determinar lo que se cree. Si tratamos con 
un ser respecto al que podamos suponerle deseos, propósitos y necesidades 
normales, ciertas pautas de conducta suministrarán indicios de ciertas cla- 
ses de creencias, y usaremos esa conducta como base de la que inferir el 
contenido de tales creencias. Pero aunque nosotros determinemos, y lo ha- 
gamos a menudo, lo que una criatura cree examinando su conducta, las 
creencias mismas no están determinadas por esa conducta. Lo que se cree 
está determinado por la etiología de las estructuras que se manifiestan en 
la conducta. 

En contraste con esta explicación etiológica de la creencia, o del con- 
tenido de la creencia, hay una manera de abordar el mismo problema que 
se orienta a los efectos. Según este último enfoque, las estructuras internas 
que median entre entradas y salidas, los estados internos que deben iden- 
tificarse con las creencias de un sistema, derivan su contenido, no de su 
origen causal, sino del sus efectos sobre la conducta. Parece que éste es un 
enfoque especialmente atractivo en relación con animales que utilicen un 
lenguaje porque las salidas de tales sistemas, o al menos algunas de ellas, 
tienen ya una dimensión semántica, un significado, que corre claramente 
parejo con la clase de contenido que pretendemos atribuir a los estados 
internos (pensamientos, creencias) que lo producen. La idea, más o menos, 
es que si k pronuncia las palabras «Hace sol» (o si está dispuesto a proferir 
estas palabras en ciertas circunstancias), y si proferencia de las mismas la 
produce de forma apropiada un estado nervioso central, entonces el estado 


—239:= 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


central tiene el contenido «Hace sol» y puede así ser identificado con la 
creencia de k de que hace sol.!** El significado de nuestra conducta verbal 
es primario. El significado o estructura intencional de nuestros estados 
cognitivos es secundario, un mero reflejo de las propiedades semánticas 
de la conducta verbal que estos estados internos producen (o tienden a pro- 
ducir). Llamaré a esta perspectiva consecuencialismo. Es, según creo, una 
versión del conductismo. Los estados internos derivan su significado de 
sus efectos sobre la conducta. 

Este enfoque del problema de la intencionalidad pierde, naturalmente, 
algo de su plausibilidad cuando pensamos en organismos que no poseen 
lenguaje. Sin embargo, la misma idea básica se aplica a menudo en una 
forma ligeramente modificada.'%* Algunas conductas son adecuadas con 
respecto a la comida. Otras son apropiadas para las situaciones de peligro. 
Normalmente, la comida se come y el peligro se evita. Lo que confiere un 
contenido proposicional a la fuente interna de una conducta es la adecua- 
ción de tales respuestas respecto de una cosa y no de otra, del mismo modo 
en que —dados los significados usuales de las palabras— la proferencia 
«Hace sol» conviene a un estado de cosas (el sol luce) más que a otro. 
Dicho de un modo un tanto tosco, si el perro la come, debe pensar que es 
comida. Pensar qué es comida es sencillamente estar en un estado que in- 
cita o mueve al perro a mostrar una conducta apropiada con la comida: 
salivación, masticación, deglución, etcétera. Los estados internos adquie- 
ren sus propiedades semánticas sólo en gracia a que resultan en una clase 
de conducta que tiene un significado o una significación independiente de 
su fuente. Las propiedades intencionales de nuestros estados internos son 
un reflejo, pero sólo un reflejo, de las propiedades intencionales de la con- 
ducta que inducen. Decir que el perro sabe o cree que s es comida no es 
decir, solamente, que el perro está en un estado que lo mueve a compor- 
tarse con s de una forma apropiada para con la comida. Si ese mismo estado 
neural moviese al perro a huir de s, tendría entonces un contenido dife- 
rente; por ejemplo: s es peligroso, un predador, o algo dañino. 





155 Este tipo de enfoque se puede encontrar en el artículo «Empiricism and the Philosophy 
of Mind» de Wilfrid Sellars, Minnesota Studies in the Philosophy of Science, H. Feigl y M. 
Scriven (eds.), University of Minnesota Press, Minneapolis, 1956, págs. 253-329. 


156 Uso a Dennet como modelo de esta descripción del consecuencialismo. Véase su Con- 
tent and Consciousness, Londres, 1969, capítulo 4. 
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Este enfoque consecuencialista del análisis de las llamadas actitudes 
preposicionales (aquellas que, como el saber y la creencia, tienen un con- 
tenido proposicional) posee cierto grado de plausibilidad. Sin embargo, 
siempre tropieza con la circularidad inherente al analizar el contenido de 
nuestros estados internos en términos de algo (las salidas, la respuesta, la 
conducta) a lo cual o bien le falta la estructura intencional necesaria (no 
tiene el significado de la clase que se necesita) o bien deriva el significado 
que posee del significado de su causa interna (las creencias, las intenciones 
y los propósitos que lo producen). En el segundo caso tiene un significado, 
pero un significado que toma prestado de su fuente interna. En ninguno de 
los dos casos está dotada para ser el lugar en el que se concentra primaria- 
mente el significado o el contenido. 

Esta circularidad aparece con el máximo de claridad cuando se pre- 
tende comprender la estructura intencional de nuestras actitudes cognitivas 
(la creencia y el conocimiento) en términos de nuestra conducta verbal. 
Pues es claro, en mi opinión, que lo importante en nuestra conducta verbal 
no son la frecuencia, la amplitud o la duración de las pautas acústicas que 
producimos al hablar, sino lo que logramos decir cuando producimos tales 
pautas. Es decir, lo pertinente para el contenido de los estados internos 
responsables causalmente de nuestras proferencias es el significado de ta- 
les preferencias. La única forma en que la estructura intencional de la 
creencia podría analizarse en términos de la estructura intencional de nues- 
tra conducta verbal es si esta conducta verbal tuviera ya un contenido se- 
mántico del orden de intencionalidad necesario, es decir, tuviera ya un sig- 
nificado cuyo análisis no dependiera de las intenciones o de las creencias. 
Pero parece más natural decir (siguiendo a Paul Grice)!*” que la intencio- 
nalidad de nuestra conducta simbólica, el hecho de que ciertas proferen- 
cias, gestos y signos tengan lo que Grice llama un significado no natural 
(algo con un contenido semántico) se deriva de la estructura semántica de 
esos estados internos (en particular, las intenciones y las creencias) que 
dan lugar a esa conducta. Si este enfoque es, como creo, correcto, aunque 





157 H, P. Grice, «Meaning», Philosophical Review, vol. 66 (1957), págs. 377-388. Véase 
también su «Utterer”s Meaning and Intentions», Philosophical Review; vol. 78 (1969), págs. 
147-177, y «Utterer?s Meaning, Sentence-Meaning, and Word Meaning», Foundations of 
Language, vol. 4 (1968), págs. 225-242. 
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sea aproximadamente, entonces suponer que nuestros estados internos de- 
rivan su contenido de la conducta que ellos producen es poner las cosas 
exactamente al revés. Lo que ocurre, en cambio, es que nuestra conducta 
verbal significa algo (en el sentido no natural de «significado» de Grice) 
porque es una forma establecida que tienen determinados agentes con de- 
terminadas creencias de satisfacer ciertas intenciones comunicativas. 

Precisamente por esta razón sería estúpido atribuir creencias a las má- 
quinas (por ejemplo, a un computador digital) simplemente porque sus sa- 
lidas (outputs) consisten en símbolos con significado. Sería estúpido in- 
cluso si el significado de los símbolos de las mismas correspondiera a la 
información procesada por la máquina, porque la cuestión debe ser siem- 
pre: ¿de dónde les viene el significado (la significación semántica) a estos 
símbolos? Puedo reemplazar el timbre de una puerta por una cinta magne- 
tofónica que emita los sonidos «Hay alguien en la puerta» cuando, y sólo 
cuando, alguien pulse el botón del timbre, pero esto no significa que el 
sistema manifieste entonces la creencia de que hay alguien en la puerta. 
La información de que hay alguien en la puerta se recoge y se procesa. Se 
la transmite en una forma acústica (a saber, los sonidos, «Hay alguien en 
la puerta») que puede decirse que significa que hay alguien en la puerta. 
Pero éste es un significado que la pauta acústica tiene para nosotros, no 
para el sistema del cual es una salida. Desde el punto de vista del sistema 
mismo, no tiene más significado (contenido semántico) del que tiene el 
sonido de un timbre normal cuando alguien pulsa el botón. Puede decirse 
que la salida significa que hay alguien en la puerta en el sentido natural de 
«significado» de Grice, pero esto es sencillamente lo mismo que decir que 
(como el sonido de un timbre normal) lleva la información de que hay 
alguien en la puerta. La salida (en cualquiera de sus formas) carece de 
contenido semántico. No presenta el tercer nivel de intencionalidad carac- 
terístico de los significados lingiiísticos. Esta es la razón por la que no se 
puede calificar de conducta verbal. 

No podemos tomar una propiedad de la salida o la conducta (el signi- 
ficado o el contenido semántico de los símbolos producidos por un sis- 
tema) y asignársela a la causa de esa salida o esa conducta porque, hasta 
que la causa no tenga un contenido semántico independiente, la salida o la 
conducta no tienen lo que se requiere para atribuirles las propiedades se- 
mánticas pertinentes. No tienen la clase necesaria de significado (signifi- 
cado lingúístico o no natural). Si es que un computador ha de creer algo, 


== 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


debe tener estructuras internas con el contenido semántico pertinente. Si 
las tiene, entonces tiene creencias, sea el que fuera el significado conven- 
cional de sus salidas (en caso de haberlo). Si no las tiene, entonces las 
salidas (cualquiera que sea su significado convencional para nosotros) no 
son pertinentes para la asignación de atributos cognitivos. 

Aun cuando dejemos a un lado nuestra conducta verbal (o al menos el 
aspecto de la misma que concierne al significado convencional de los so- 
nidos e inscripciones que hacemos), el consecuencialista se enfrenta al 
mismo problema en una forma ligeramente diferente. La adecuación de 
nuestra conducta no es algo a lo que se pueda reducir el significado o el 
contenido de los estados internos que la producen, pues hasta que los es- 
tados internos que producen esa conducta no tengan un significado inde- 
pendiente de la conducta que provocan, la conducta no puede considerarse 
ni adecuada ni inadecuada. Si quiero engañar a un amigo ciego sobre la 
hora, no hay ciertamente nada inadecuado en mis palabras «Hace sol» 
cuando sé (o creo) que es medianoche. Al menos no hay nada desafortu- 
nado en ello en cualquier sentido de «apropiado» que diga algo sobre lo 
que yo sé o creo. La gallina huye del zorro, a no ser que quiera proteger a 
sus polluelos. En este caso podría atraer su atención con una conducta que 
podríamos juzgar más apropiada para un alegre encuentro. Si un hombre 
quiere morir, comer lo que él cree que son setas venenosas puede ser lo 
apropiado. Si quiere vivir, eso no es lo adecuado. Hasta que no sabemos 
lo que un hombre quiere hacer, cuáles son sus intenciones, propósitos y 
creencias, su conducta no puede ser juzgada ni como adecuada ni como 
inadecuada. La adecuación de la conducta es una propiedad de la misma 
que revela huellas indicadoras de su fuente intencional. Siendo así, no se 
puede usar esta propiedad para analizar la estructura intencional de los es- 
tados internos que originan la conducta, pues hasta que éstos no tengan un 
contenido semántico de la clase que estamos tratando de entender, la con- 
ducta no tendrá aquella propiedad. Una vez más, esto es poner las cosas 
justamente al revés. 

¿Cuál es, a pesar de todo, la conducta adecuada a la creencia de que s 
es una margarita, un árbol, un perro, agua, un hígado, el cartero o el sol? 
Cuál sea la respuesta adecuada a estas creencias depende no sólo de cuáles 
sean las intenciones y propósitos de unos, sino también de las otras creen- 
cias que uno tenga. Una animal olfatea una margarita y se la come sin 
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dilación; otro la olfatea y se aleja; un tercero simplemente le echa un vis- 
tazo casual. El caballero corta la flor y se la pone en la solapa, el jovencito 
la pisotea y el jardinero la riega. Determinar cuál de estas respuestas es la 
apropiada (aparte de las creencias e intenciones de los agentes) es una mi- 
sión estúpida. Incluso si yo quiero destruir todas las margaritas, y creo que 
esto es una margarita, no hay nada desafortunado en el hecho de que la 
riegue. No lo hay si creo (equivocadamente) que el agua la matará. 

Hay palabras que usamos para describir creencias que sugieren cómo 
va a responder probablemente el agente que tiene la creencia. Son ejem- 
plos términos como predador, comida, peligroso, obstáculo, dañino, inse- 
guro, refugio, útil, amenazador, provocativo y amable. Decir que el animal 
cree que s es peligroso es decir algo sobre el modo en que es probable que 
el animal responda a s. Decir que cree que s es comida es decir algo sobre 
el modo en que es probable que se comporte el animal (de tener hambre) 
con respecto a s. Pero esto no es nada más que una sugerencia. La suge- 
rencia proviene del hecho de que estos conceptos están más o menos di- 
rectamente relacionados a las necesidades y propósitos normales del ani- 
mal. Y sí tratamos con un animal cuyas necesidades y propósitos se puede 
suponer que son los normales, podemos esperar razonablemente ciertas 
pautas distintivas de conducta. Dennet nos habla de un perro que, cuando 
se le muestra un bistec, hace un agujero a modo de nido, pone el bistec 
dentro y se sienta en él.'% ¿Piensa el perro que el bistec es un huevo (y que 
él mismo es una gallina)? ¿O cree que realmente es un bistec (o que es 
comida) y quiere confundir a los observadores? Si esto suena demasiado 
raro, supongamos que se le ha enseñado al perro a proceder de esta manera 
tan insólita con el bistec. En este caso la conducta del perro es perfecta- 
mente adecuada, pero debería estar también claro que ahora estamos 
usando el término «adecuado» justamente para describir la conducta del 
perro relativa a los deseos insólitos que ha adquirido en su aprendizaje. 
Los perros (los perros normales) no sólo se comen los alimentos, sino que 
también los esconden, los entierran y orinan sobre ellos. La única razón 
que alcanzo a ver de por qué toda esta conducta es adecuada para con los 
alimentos es a causa de los supuestos (ocultos) sobre lo que el perro trata 
de hacer: cuáles son sus intenciones, sus propósitos y sus otras creencias. 





158 Óp, cit., pág. 77. 
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Es decir, la conducta se puede clasificar en adecuada o inadecuada en re- 
lación con el contenido supuesto de esos estados internos que la ocasionan. 
Por consiguiente, es enteramente circular sugerir, como lo hace el conse- 
cuencialista, que el contenido de los estados internos del perro es analiza- 
ble en términos de la adecuación de la conducta que producen. 

Lo que hacemos es relativo, no sólo a lo que creemos y pretendemos, 
sino también a muchísimas circunstancias de importancia secundaria que 
llevan a completar con éxito esas cosas que tratamos de hacer. Después de 
todo, no siempre logramos llevar a término lo que intentamos hacer. El 
hecho de que salpique mi cara con agua en lugar de bebérmela, rompa el 
vaso en lugar de ponerlo en el estante (como yo pretendía), puede que no 
indique nada sobre mis creencias o mis intenciones. Puede indicar algo 
sobre mi coordinación. Consideremos, como ejemplo extremo de esto, el 
caso de las desafortunadas salamandras cuyos dos miembros delanteros, 
derecho e izquierdo, son intercambiados de manera que cada uno de ellos 
«mira hacia atrás». Las salamandras tienen la suficiente capacidad regene- 
rativa para que los miembros intercambiados se curen en sus nuevas posi- 
ciones y queden conectados con los nervios de la medula espinal. Sucede 
entonces que los animales a los que se ha operado realizan movimientos 
de los miembros delanteros que apartan al animal de la comida y lo acercan 
a estímulos nocivos.'*” ¿Son adecuadas o inadecuadas las respuestas de la 
salamandra? En un sentido son desafortunadas. El rabo y los miembros 
posteriores trabajan contra los miembros delanteros y el animal se balan- 
cea hacia delante y hacia atrás sin moverse nunca del lugar. ¿Qué nos dice 
tal conducta sobre las creencias del animal? Poco o nada. Si la criatura 
tiene creencias, fácilmente podemos suponer que con respecto a la comida 





159 Véase la discusión de estos experimentos y sus implicaciones en The Metaphorical Brain 
de Michale A. Arbib, Wiley-Interscience, Nueva York, 1972, págs. 153-155. Véase también 
«Central versus Peripheral Factors in the Development of Coordinaron» de P. Weiss, en Per- 
ception and Action de K. H. Pribram, Penguin Books, Middlesex, Inglaterra, 1969, págs. 491- 
514. Es interesante leer la interpretación particular que da Weiss de estos experimentos: «La 
coordinación es algo que se refiere a la relación ordenada de las partes. Tal orden puede o no 
ser de inmediata utilidad biológica. El hecho de que, en el cuerpo normal, la coordinación 
por lo general tenga sentido cuando se ve desde el punto de vista de las necesidades biológicas 
del organismo, sugiere naturalmente que la utilidad biológica es un factor fundamental para 
determinar la coordinación. Esto es una ilusión, pues, como demostraremos más adelante, las 
pautas básicas de la coordinación se desarrollan y persisten incluso en casos en los que sus 
efectos son totalmente contrarios a los intereses del individuo» (págs. 491-492). 
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cree que efectivamente es comida, y con respecto al estímulo nocivo que 
es nocivo, aun cuando tales creencias nunca logren traducirse en respues- 
tas adecuadas. Incluso si la criatura padeciera desde su nacimiento esta 
debilitante falta de coordinación motora, podríamos todavía suponer, a pe- 
sar del hecho de que sus respuestas nunca (ni incluso originalmente) fue- 
ran adecuadas, que reconocía la comida y los estímulos nocivos. '% Pues 
lo que da a los estados internos el contenido de esto es comida y esto es 
nocivo (la clase de contenido pertinente cuando se atribuye al animal el 
reconocimiento de la comida como tal comida y del estímulo nocivo como 
efectivamente nocivo) no es la adecuación de la conducta que estos estados 
inspiran, sino la clase de nueva información a la que son sensibles estos 
estados internos. Puesto que las salamandras que se han descrito obvia- 
mente tienen codificada la información en la forma normal, sus estados 
internos tienen un contenido que corresponde a esta información, por muy 
desafortunada que sea la conducta que estos estados internos determinan. 

La significación de esta interferencia en las relaciones normales en- 
trada-salida puede señalarse mejor aún comparando el tipo de caso que se 
acaba de describir con el de los experimentos de cambio rotatorio de los 
ojos de un animal. R. W. Sperry relata el siguiente experimento. '*! 


Nuestro primer experimento fue invertir el ojo del tritón, para averiguar si esta 
rotación del globo ocular produciría una visión al revés, y, de ocurrir así, si la vi- 
sión invertida podría ser corregida por la experiencia y el entrenamiento. Seccio- 
namos el globo ocular de los párpados y los músculos, dejando intactos el nervio 
óptico y las principales venas, y giramos entonces el globo del ojo unos 180 grados. 





160 Es importante señalar a este respecto que los animales parecen incapaces de aprender o 
compensar la inversión de sus miembros. Algunos permanecieron así más de un año, sin 
observarse cambio alguno en su conducta (Arbib, óp. cit., pág. 154). El que persista esta 
conducta inadecuada no nos puede llevar a decir que los animales tienen creencias sobre los 
estímulos que reciben, o que no deben creer que la comida que ven sea comida; sino todo lo 
contrario. En tanto en cuanto persista la conducta inadecuada de modo consistente o uni- 
forme, esa conducta da indicios de alguna creencia. La cuestión de cuál es la creencia que 
tiene el animal es algo que hay que decidir mediante el contenido semántico de esa estructura 
interna que produce la conducta inapropiada, y esto, como hemos argumentado, es una fun- 
ción de la herencia informativa de tal (tipo de) estructura (en este caso, quizás, innata; véase 
el capítulo 9 para una discusión de los conceptos innatos). 


161 R, W. Sperry, «The Eye and the Brain», Scientific American, mayo 1956; reimpreso en 
Perception: Mechanisms and Models, W. H. Freeman and Company, San Francisco, págs. 
362-366. 
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Los tejidos se curaron rápidamente y el globo ocular quedó fijo en la nueva posi- 
ción. 

Se comprobó la visión de los animales operados de esta forma. Sus respuestas 
mostraron claramente que su visión estaba invertida. Cuando se situaba un cebo 
por encima de su cabeza, el tritón empezaba a excavar en los guijarros y la arena 
del fondo del acuario. Cuando se le presentaba el cebo delante de su cabeza, se 
giraba y empezaba a buscar en la cola. 

...Los tritones operados nunca aprendieron a ver normalmente durante el expe- 
rimento. Algunos estuvieron hasta dos años con sus ojos invertidos, pero no mos- 
traron ningún progreso significativo. 


Una vez más tenemos que los animales persisten en una forma de con- 
ducta desafortunada, pero, al contrario que en el caso de la salamandra, 
consideramos que este caso es un resultado de creencias diferentes por 
parte del animal. La salamandra sabía dónde estaba la comida, pero no 
podía conseguirla. El tritón está perfectamente coordinado, puede obtener 
la comida, pero no sabe dónde está. Parece natural decir que el tritón tiene 
creencias falsas, pero no la salamandra, porque, aunque las respuestas de 
tritón sean tan desafortunadas como las de la salamandra, en el caso del 
tritón tenemos razón al creer que esas respuestas son producidas por una 
estructura interna con un contenido falso. Es decir, las señales que llevan 
la información de que el cebo está delante, señales que anteriormente (an- 
tes de girar el ojo) fueron codificadas de una manera, ahora (después del 
giro) se están codificando en una estructura que está diseñada para llevar 
la información de que el cebo está detrás. La información de que el cebo 
está delante produce ahora (como resultado de la rotación del ojo) una es- 
tructura semántica que tiene el contenido: el cebo está detrás. La informa- 
ción sobre la localización del cebo se codifica en una estructura completa- 
mente diferente, estructura que tiene un contenido falso y que (en virtud 
de las anteriores conexiones eferentes) continúa produciendo la conducta 
desafortunada. 

Sugiero que estas consideraciones muestran que los estados internos 
de un sistema no derivan su contenido de la adecuación o inadecuación de 
sus efectos sobre las salidas o la conducta del sistema, sino de su papel de 
portadores de información, de la clase de situación cuya representación 
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desarrollaron con el tiempo (o que representaban innatamente).!'* Con ani- 
males cuyo funcionamiento es normal, podemos usar sus respuestas como 
base para hacer inferencias sobre lo que creen (quieren y pretenden), pero 
no se debería confundir esta relación epistemológica (determinación de la 
causa por el efecto) con algo más sustancial como, por ejemplo, la deter- 
minación ontológica de la causa (la creencia) por el efecto (la conducta). 
Los estados internos derivan su contenido (al menos en primera instancia) 
de su origen informativo, no de sus efectos, aunque —desde un punto de 
partida evolutivo— es difícil ver por qué o cómo podrían desarrollarse es- 
tructuras de este tipo a no ser que tuvieran algún efecto beneficioso (y por 
ello adecuado) sobre la conducta. 

Hay una reticencia comprensible por parte de algunos filósofos en la 
atribución de creencias a animales que no posean lenguaje. Pienso que tal 
cautela es prudente. No sabemos cuál es el contenido semántico de sus 
estados internos, o bien sospechamos que, si tienen un contenido, puede 
no ser expresable en nuestro lenguaje. Suena un poco extraño (al menos a 
mí) que el gato se describa con la creencia de que s es un hígado, aunque 
parece un poco más natural describirlo con la creencia de que s es comida 
(o algo para comer). Puedo dudar al describir a mi perro con la creencia de 
que s es un cartero, pero estoy más predispuesto a describirlo con la creen- 
cia de que s es un intruso o un extraño. Las palabras «comida», «intruso» 
y «extraño» están más estrechamente ligadas a pautas de conducta carac- 
terísticas (en animales con necesidades, deseos y propósitos normales), y 
puedo así atribuir con más confianza las creencias en estos términos que 
en otros. Con todo, esta reticencía por nuestra parte en asignar un conte- 
nido más concreto a los estados internos de una criatura no implica que no 
haya creencias más específicas. El gato puede creer que s es hígado. El 
perro puede creer que s es el cartero. Todo depende de si el estado que 
determina su respuesta (o disposición a responder) a s tiene eso, o tiene 
alguna otra cosa (o nada en absoluto), como contenido semántico. Si el 
gato come sólo hígado, si el perro solamente ladra y se precipita sobre el 





162 En el próximo capítulo retomaré el tema de los conceptos innatos, es decir, un tipo de 
estructura semántica que es —con anterioridad a la clase pertinente de experiencia o apren- 
dizaje— sensible de una forma selectiva a ciertos tipos de información. Un concepto innato 
es sencillamente un tipo de codificación de información que un sistema no desarrolló ni ad- 
quirió; nació (ya preprogramado, por decirlo así) con esta forma de digitalizar la nueva in- 
formación. 
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cartero (no sobre este cartero, sino cualquiera que traiga la corresponden- 
cia), existen datos que sugieren que el gato reconozca esta comida como 
hígado (cree que es hígado) y que el perro reconozca al intruso como el 
cartero (cree que es el cartero), ya que estas respuestas características in- 
dican que los animales responden a determinadas informaciones, a saber, 
la información de que s es hígado (no sólo comida) y s es el cartero (no 
sólo cualquier extraño). Deberíamos darnos cuenta de que las respuestas 
no son particularmente adecuadas (no lo son, al menos, en una forma que 
ayude a definir el contenido de la creencia). Si el gato se niega a comer 
sólo hígado, y el perro mueve su rabo en presencia del cartero (y sólo en 
su presencia), podríamos hacer inferencias similares sobre lo que creerían 
entonces. La clave de lo que ellos creen es el significado de las estructuras 
que determinan su respuesta a s (sea cual fuere esta respuesta), y el signi- 
ficado de estas estructuras es su contenido semántico: la clase de informa- 
ción que hizo que esas estructuras se desarrollaran para transportarla en 
una forma completamente digitalizada. 

Se puede objetar que nuestro hipotético perro y nuestro hipotético gato 
merecen menos crédito. Sus respuestas discriminatorias (al hígado y el car- 
tero) muestran tan sólo que reconocen el hígado como comida y al cartero 
como un intruso. Además (por la razón que sea) reconocen sólo al hígado 
como comida y sólo al cartero como un intruso. Por consiguiente, no creen 
que s sea hígado y s sea el cartero. A lo sumo creen acerca del hígado — 
y sólo del hígado— que es comida y acerca del cartero —y sólo del car- 
tero— que es un intruso. Y puesto que los contenidos de estas creencias 
(que tienen que ver con comida y con intrusos) se derivan de la adecuación 
de la conducta que provocan, estamos de nuevo en la explicación conse- 
cuencialista de la creencia. !* 





163 Pienso que esta objeción capta el espíritu de la explicación sobre el contenido de la 
creencia de Dan Dennet (véase, por ejemplo, Content and Consciousness, pág. 19). Es decir, 
Dennet estaría tentado a describir al gato como algo o alguien que reconoce el hígado como, 
por ejemplo, comida. El gato no tiene una creencia que se pueda expresar con el enunciado 
«s es hígado», puesto que no hay ninguna respuesta que sea apropiada al hígado en cuanto 
tal hígado. Lo que tiene el gato es una creencia que se puede expresar con el enunciado «s es 
comida» (donde s se refiere a lo que de hecho es hígado), puesto que hay (según Dennet) 
conductas apropiadas a la comida. 
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Por supuesto, esta descripción de la situación podría ser correcta, pero 
también puede que no lo sea. Todo depende del gato y del perro. Supon- 
gamos que el gato reconoce realmente otro tipo de comida (por ejemplo, 
pollo y pescado) como comida, pero que no le gusta. Si le dejamos sin 
comer durante bastante tiempo, comerá pescado, pero sólo a la fuerza. Su- 
pongamos que el perro re conoce realmente a otros intrusos como intrusos 
(les ladra y se precipita sobre ellos), pero muestra una respuesta particu- 
larmente violenta y característica hacia los carteros. ¿Cómo explicaremos 
entonces la respuesta especial del gato ante al hígado y la respuesta espe- 
cial del perro ante los carteros? No podemos explicarlo diciendo simple- 
mente que el gato cree que el hígado es comida, porque ésta no es la res- 
puesta normal del gato ante la comida. No come la mayoría de las cosas 
que reconoce como comida. No podemos explicar la frenética reacción del 
perro ante el cartero diciendo simplemente que el perro cree que el cartero 
es un intruso, puesto que ésta no es la reacción típica del perro ante los 
intrusos. Debemos, por supuesto, asignar creencias más específicas a los 
animales para explicar estas pautas de respuesta especiales. Y ¿de qué 
otras creencias mejores podemos echar mano que la de que s es hígado 
(para el gato) y la de que s es el cartero (para el perro)? Puede que no sean 
expresiones exactas de la información a la que responden estos animales. 
Quizás se debería atribuir al perro sólo la creencia acerca del cartero de 
que éste lleva una gran bolsa de piel y hace ruido en el buzón. Quizá se 
debería atribuir al gato tan sólo la creencia acerca del hígado de que tiene 
una apariencia y huele de modo especial (la apariencia y el olor que sólo 
tiene el hígado). Sin embargo, lo que hay que tener en cuenta es que si 
hemos de dar una explicación de las respuestas discriminatorias de los ani- 
males en términos cognitivos, es decir, en términos de lo que piensan o 
saben (al menos parcialmente), debemos entonces asignar unos contenidos 
más específicos a sus estados internos que los que pueden expresarse con 
términos como «comida» e «intruso».'*% Y hasta que no se nos dé una des- 
cripción más completa de estos animales, incluyendo una descripción de 





164 Por supuesto, no necesitamos explicar la conducta del animal en «términos cognitivos», 
igual que tampoco tenemos por qué describir el modo de operar de un computador en térmi- 
nos de «decisión», «creencia», «multiplica» y «reconoce». Pero, por la misma razón, tam- 
poco estamos obligados a describir nuestro propio modo de operar en estos términos. Hay 
explicaciones neurológicas que pueden funcionar bien, o al menos algún día las habrá. Sin 
embargo, la cuestión es que estas explicaciones cognitivas no son menos válidas simplemente 
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su entrenamiento y su experiencia anterior (y por tanto de qué clase de 
estructura cognitiva pueden haber desarrollado), la creencia de que esto es 
hígado y la de que ése es el cartero parece que va tan bien como cualquier 
otra para explicar por qué el gato come esto y por qué el perro se pone tan 
excitado por eso. 

La explicación etiológica de la creencia —o del contenido de la creen- 
cia— que se ha proporcionado en este capítulo y el anterior es demasiado 
tosca para analizar muchas creencias. Como máximo se ha dado una ex- 
plicación de la capacidad de un sistema para adquirir y mantener ciertas 
creencias de re de un tipo bastante simple: creencias de la forma «Esto es 
F», donde esto es el objeto de la percepción (lo que se ve, se oye, se sabo- 
rea, etc.) y F es una expresión de algún concepto simple aprendido osten- 
sivamente. No he dicho nada sobre el modo en que puede adquirirse la 
capacidad para mantener creencias de la forma «Mi abuela ha muerto» (es 
decir, ciertas creencias de dicto) en las que la referencia —aquello acerca 
de lo cual versa la creencia— se fija de otra manera distinta de la percep- 
tiva. Tampoco he dicho nada acerca de creencias que implican conceptos 
sobre cuyos especímenes no se ha recibido nunca información, bien sea 
porque el concepto en cuestión no los tiene (por ejemplo, fantasmas, mi- 
lagros, unicornios) bien porque, aunque los haya, el sujeto de la creencia 
nunca se ha visto expuesto a ellos. ¿Cómo puede un organismo desarrollar 
una estructura semántica apropiada, algo que signifique que x es F, si 
nunca ha recibido información de que algo sea FF? 

Aunque todavía no hemos dicho nada sobre estos temas y, en esta me- 
dida, el análisis queda incompleto, pienso que hemos dicho lo suficiente 
sobre el enfoque del significado y de las estructuras cognitivas que pro- 
porciona una teoría de la información, como para mostrar que el mismo es 
prometedor para enfrentarse a estos problemas. Lo que hasta aquí hemos 
dado es un análisis de las creencias de re simples que implican conceptos 
primitivos!%. Hemos proporcionado, por tanto, una semántica del lenguaje 





porque haya explicaciones causales alternativas. El hecho de que se pueda describir la ope- 
ración de un voltímetro en términos puramente causales no significa que una descripción 
basada en una teoría de la información sea falsa o inaplicable. 


165 En el próximo capítulo se hablará más de los conceptos primitivos. Estos conceptos son 
un tipo de estructura cognitiva que no se descompone en partes que sean estructuras cogniti- 
vas. 
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interno del pensamiento y la creencia asignando un significado, es decir, 
un contenido semántico del nivel de intencionalidad necesario, a los esta- 
dos internos de un sistema que procesa información. Lo que aún no hemos 
descrito es la sintaxis de este lenguaje interno, los mecanismos combina- 
torios y transformacionales de que se dispone —o que pueden desarro- 
llarse— para enriquecer los recursos expresivos de estos morfemas inter- 
nos. Diremos algo sobre estos temas en el último capítulo. Pero por el mo- 
mento debemos contentarnos con la observación de que la semántica que 
se proporciona, el significado o contenido asignado a estas estructuras in- 
ternas, es algo que ha sido capaz de suministrarnos nuestra teoría de la 
información. Esto, a su vez, implica que el problema del significado, en la 
medida en que éste se refiere al contenido proposicional de nuestras acti- 
tudes, es algo que puede comprenderse utilizando solamente los recursos 
de que dispone la teoría física. Las creencias (y, por tanto, el conocimiento) 
han sido identificadas con estados o estructuras físicas. Una creencia se 
materializa mediante o en una estructura física. Sin embargo, el contenido 
de la creencia es algo bastante diferente de la estructura física en la cual se 
materializa. Del mismo modo en que la información contenida en un dia- 
fragma debe distinguirse del diafragma mismo (dado que la misma infor- 
mación se puede encontrar en otro lugar, en estructuras físicas diferentes), 
debe distinguirse una creencia de su materialización concreta en el sistema 
(en su hardware). Una creencia es una estructura física que tiene tanto 
propiedades representacionales como funciona les en el sistema del cual 
forma parte. Si otro sistema tiene una estructura interna con las mismas 
propiedades representacionales (y algunas propiedades funcionales, tal 
vez diferentes), entonces tiene una creencia con ese mismo contenido. 
Puesto que las dos estructuras son numéricamente distintas, en cierto sen- 
tido estructuras distintas físicamente —y bien diferentes desde un punto 
de vista físico (y no digamos ya funcional) — pueden ser la misma creen- 
cia, aunque sigan siendo creencias distintas. Son creencias distintas en el 
sentido en que las creencias de Jack y las creencias de Jill son diferentes 
(si Jack muere, Jill todavía sigue teniendo creencias), pero son la misma 
creencia en que lo que creen (por ejemplo, que la cuesta es empinada) es 
lo mismo. !% 





166 Aunque he criticado la explicación consecuencialista del contenido mental, se mantiene 
en el presente análisis bastante de lo que los funcionalistas dicen sobre la reducción de lo 
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mental a lo físico. Por ejemplo, la distinción de Putnam entre los estados lógicos y estructu- 
rales es la misma que hago entre un estado informativo (una estructura semántica o cognitiva) 
y la estructura física en la que la información (contenido semántico o cognitivo) se puede 
materializar. Dos estructuras físicas totalmente diferentes pueden tener el mismo contenido 
semántico. Véase el artículo «Minds and Machines» de Putnam en Mind, Language and Rea- 
lity: Philosophical Papers, vol. IL, Cambridge University Press, Cambridge, Inglaterra, 1975, 
págs. 362-385. 
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9. Los conceptos y el significado 


Un concepto es un tipo de estructura interna que se caracteriza porque 
su contenido semántico, cuando se ejemplifica, ejerce un control sobre las 
salidas (la conducta) del sistema. Cuando este tipo de estructura —que 
tiene un contenido que puede expresarse mediante «x es F»— se ejempli- 
fica con respecto a un objeto perceptivo s, tenemos entonces una creencia 
(de re) con el contenido (preposicional): s es F. Así pues, las creencias 
requieren conceptos, y, recíprocamente, los conceptos implican la capaci- 
dad de tener creencias. Si los conceptos se consideran como estructuras 
que tienen un significado, entonces los conceptos están «en la cabeza». Sin 
embargo, no hay que pensar que esto implique que los significados están 
en la cabeza. 

Un sistema tiene conceptos en la medida en que sus estados internos 
constituyen un emparejamiento, algún grado de coordinación, entre entra- 
das y salidas. Pero el hecho de que exista esta clase de coordinación entre 
las entradas y las salidas no determina cuáles sean los conceptos que tiene 
el sistema. Los conceptos que tiene un sistema dependen de cuál sea la 
clase de información con la que ese sistema se haya coordinado. 

Una estructura semántica no constituye un concepto hasta que no ha 
habido un emparejamiento de sus papeles representativo y funcional (es 
decir, hasta que no se ha convertido en una estructura cognitiva), pero cuál 
sea el concepto involucrado es algo que se determina por sus propiedades 
representativas (semánticas). A este respecto un concepto es una estructura 
con dos caras: una que mira hacia atrás, hacia los orígenes informativos; 
la otra que mira hacia adelante, hacia los efectos y las consecuencias. Nin- 
guna estructura constituye un concepto a menos que tenga los dos aspec- 
tos, el informativo que mira hacia atrás y el funcional que mira hacia ade- 
lante, pero lo que da a la estructura su identidad conceptual, lo que la hace 
ser este concepto en lugar de aquel otro, es su especificidad etiológica. 
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Conceptos simples y complejos 


Hasta aquí he dejado de lado una característica importante de las es- 
tructuras semánticas, una característica que se presenta como un estorbo 
para la explicación que hemos dado de las creencias y sus conceptos aso- 
ciados. Consideremos dos propiedades que sean equivalentes, tanto nómi- 
camente (hay una ley que nos dice que / si y sólo si G) como analíticamente 
(F significa lo mismo que G) Si F y G son equivalentes de este modo, 
entonces cualquier señal que lleve la información de que s es F también 
lleva la información de que s es G, y viceversa. Las dos informaciones son, 
por decirlo así, inseparables. Por tanto, si una estructura constituye una 
digitalización completa de una de las informaciones, también constituye 
una digitalización completa de la otra. Cualquier estructura que tenga el 
contenido semántico: x es F tendrá también el contenido: x es G. Pero, 
dado el análisis de los conceptos (y la creencia) en términos del contenido 
semántico de una estructura, esto tiene la con secuencia de que es imposi- 
ble que alguien crea que s es F sin creer que s es G, y viceversa. Los con- 
ceptos F y G resultan ser el mismo concepto. Y, sin embargo, parece claro 
que estos conceptos deben distinguirse. Distinguimos la creencia de que s 
es F de la creencia de que s es G incluso cuando las propiedades de la F- 
idad y G-idad son nómicamente equivalentes, incluso (a veces) cuando las 
expresiones «FF» y «G» son sinónimas. 

La solución a esta dificultad radica en reconocer el alcance restringido 
del análisis que hasta que se ha hecho. Hemos trata do principalmente de 
los conceptos simples, primitivos, es decir, de conceptos que no se des- 
componen ellos mismos en estructuras cognitivas más elementales. Si nos 
centramos en los conceptos sim pies, las anteriores observaciones son per- 
fectamente válidas, pero no constituyen realmente una objeción. En efecto, 
el único caso en que un sistema puede tener conceptos F' y G distintos, 
cuando es tos conceptos son equivalentes en uno de los sentidos descritos, 
es cuando al menos uno de ellos es complejo, es decir, cuando uno de ellos 
está construido a partir de elementos conceptuales y el otro no está cons- 
truido con esos mismos elementos. Así, por ejemplo, si el que s sea F es 
equivalente (analítica o nómicamente) a que s sea G, pero el que s sea G 
consiste, a su vez, en ser H y K (para el sistema en cuestión), entonces, a 
pesar de la equivalencia semántica de las dos estructuras cognitivas (tienen 


— 255 — 


FRED L DRETSKE CONOCIMIENTO E INFORMACIÓN 


el mismo contenido semántico), siguen siendo estructuras cognitivas dis- 
tintas. Siguen siendo distintas a causa de las diferencias en su composi- 
ción. Una estructura cognitiva con el contenido s es G es una estructura 
compuesta cada uno de cuyos componentes es determinante de la salida o 
conducta. De ahí que estas estructuras semánticamente equivalentes influ- 
yan en la conducta de diferentes maneras. Puede ser difícil decir partiendo 
sólo de la salida si la creencia que se manifiesta es una creencia que im- 
plica un concepto simple (es decir, s es F) o un concepto complejo (s es 
G), puesto que estas dos estructuras —la una conceptualmente simple, la 
otra compleja— pueden de hecho dar por resultado la misma conducta. Sin 
embargo, de la misma manera que podemos distinguir el efecto de fuerzas 
conjuntas y el efecto de una sola fuerza que constituye su suma vectorial 
modificando las condiciones de alguna forma adecuada (por ejemplo, por 
protección selectiva), podemos también detectar las diferencias en la com- 
posición de creencias semánticamente equivalentes. 

Dos individuos diferentes pueden responder ambos ante un cuadrado 
con una conducta que indica que creen que es un cuadrado (por ejemplo, 
ambos dicen «Esto es un cuadrado»). Sin embargo, uno puede estar dando 
expresión a una creencia compleja, una creencia que incluye la idea de 
figura-de-cuatro-lados, y el otro estar expresando una creencia (concep- 
tualmente) simple. Este último puede incluso no tener el concepto de fi- 
gura-de-cuatro-lados. El individuo en cuestión debe obviamente apoyarse 
en la información de que s tiene cuatro lados al reconocer s como cua- 
drado, pero si carece de este concepto no tendrá ninguna estructura cogni- 
tiva que tenga como contenido semántico el ser figura-de-cuatro- lados. 
Por eso no tendrá la capacidad de reconocer los cuadrados, los rectángulos 
y los paralelogramos como la misma clase de figura. Esta puede ser la 
situación de una paloma o un mono que han sido enseñados a coger con el 
pico (o empujar) solamente objetos cuadrados. No hay ninguna razón para 
pensar que estos animales tienen el concepto de cuadrilátero sólo porque 
nosotros estemos pensando en un cuadrado como una idea compleja que 
incluye la noción de figura-de-cuatro-lados. Para ellos el concepto de cua- 
drado puede ser primitivo, algo que no tiene partes conceptuales. Lo 
mismo se podría decir de un niño de dos años, que todavía no ha aprendido 
a contar. 

Lo que es imposible en la explicación de las cosas que estoy dando es 
tener dos conceptos primitivos que sean equivalentes. Si son equivalentes, 
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las estructuras cognitivas con las que se identifican tienen exactamente el 
mismo contenido semántico. Si los dos son primitivos, este contenido no 
articulado es, en ambos casos, lo que controla la salida o conducta. Ten- 
dríamos una distinción que no marcaría diferencia alguna. El que ambos 
sean primitivos y (semánticamente) equivalentes los hace ser idénticos.!* 

Pienso que es así como debe ser. Estamos tratando de dar una explica- 
ción de la intencionalidad de la creencia. Hemos logrado mostrar cómo es 
posible que la creencia de que s es F pueda diferenciarse de la creencia de 
que s es G, y cómo, por ello, podrían diferenciarse los conceptos F y G, a 
pesar de la equivalencia semántica de las estructuras correspondientes. 
Esto nos da el nivel de intencionalidad que deseamos. Tratar de ir más 
lejos, tratar de separar o distinguir conceptos primitivos equivalentes, es 
perseguir un nivel de intencionalidad más allá del que encontramos en las 
estructuras cognitivas tal como se concibe a éstas comúnmente. En efecto, 
no distinguimos creencias que implican conceptos semánticamente equi- 
valentes a no ser que el menos uno de estos conceptos sea complejo, a no 
ser que podamos distinguir las creencias (y los conceptos) en términos de 
su estructura composicional. Por ejemplo, podemos distinguir la creencia 
de que s es un cuadrado de la creencia de que s es un equilátero de ángulos 
rectos con tal de que podamos tratar el concepto cuadrado como un con- 
cepto simple (primitivo) para el sujeto en cuestión o, al menos, como un 
concepto que tiene una resolución (conceptual) diferente de la de ser un 
equilátero de ángulos rectos. Mientras podamos tratar el concepto cua- 
drado como simple, la creencia de que s es un equilátero de ángulos rectos 
compromete al sujeto que tiene la creencia con algo a lo que no compro- 
mete la creencia de que s es un cuadrado, a saber, la creencia de que s es 
un equilátero. Y esta diferencia en la creencia corresponde a una diferencia 
en la conducta (o en la disposición a comportarse) con respecto a s y a 
otras figuras. 





167 Tdénticos conceptualmente. Dos estructuras pueden ser conceptualmente idénticas (es 
decir, estructuras cognitivas con el mismo contenido semántico) y, sin embargo, cuando se 
dan en sistemas diferentes, ser estructuras físicamente diferentes. Lo que hace que estas es- 
tructuras físicamente diferentes sean el mismo concepto es el hecho de que las dos estructuras 
tengan el mismo contenido semántico. Por supuesto, pueden provocar tipos diferentes de 
conducta, pero la diferencia de conducta (como argumentamos en el capítulo 8) no es impor- 
tante. 
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Consideremos la identificación teorética de la luz con las ondas elec- 
tromagnéticas, el sonido con las vibraciones del aire (o del medio), el calor 
con el movimiento de las moléculas y el agua con H20. Aun cuando supu- 
siéramos que ser H20 es una propiedad esencial (y la única propiedad 
esencial) del agua, incluso si suponemos, por tanto, que no hay distinción 
informativa entre el que algo sea agua y el que sea H20 (cada estructura o 
señal que lleva una de las informaciones lleva necesariamente la otra), to- 
davía podemos señalar una clara diferencia entre una estructura cognitiva 
con el contenido de que x es agua y una estructura cognitiva con el conte- 
nido de que x es H20. Estas estructuras cognitivas pueden diferir con tal 
de que consideremos la una como distinta en su composición de la otra (y 
por tanto distinguible funcionalmente). Tener contenidos semánticos idén- 
ticos no es suficiente para que dos estructuras sean la misma estructura 
cognitiva. Esas estructuras deben ser además indistinguibles funcional- 
mente para el sistema del que forman parte. Y si una de las estructuras es 
una estructura compuesta, con partes que son ellas mismas estructuras cog- 
nitivas, y la otra no (o está construida a partir de estructuras cognitivas más 
simples de una forma diferente), entonces las dos estructuras constituyen 
conceptos diferentes a pesar de su equivalencia semántica. Es este hecho 
lo que hace posible distinguir, puramente sobre bases de la teoría de la 
información, entre la creencia de que s es agua y la creencia de que s es 
HO, a pesar del hecho de que la información de que s es agua no puede 
distinguirse de la información de que s es H20.'88 

Esto posibilita que la creencia de que el agua está compuesta de molé- 
culas de H20 no sea una creencia trivial, a pesar del hecho de que lo que 
se cree, el contenido de la creencia, tiene un valor informativo nulo. Pues 
aunque no hay información asociada con el hecho de que el agua sea H20 





168 Pienso que las mismas observaciones se pueden hacer sobre algunos ejemplos de Quine 
(véase Word and Object, Boston, 1960, capítulo 2), por ejemplo, la diferencia entre creer que 
s es un conejo y creer que t (alguna parte de s) es una parte no separada de un conejo o la 
creencia de que u (algún estadio temporal de s) es un trozo de conejo. Estas informaciones 
son inseparables. Cualquier estructura que tenga la primera información como contenido se- 
mántico tiene también las otras como contenido semántico. Sin embargo, son conceptos di- 
ferentes en su composición. Puedo creer que s es un conejo sin tener el concepto parte (o 
estadio), pero no puedo tener las dos últimas creencias sin estos conceptos. Estas diferencias 
conceptuales son detectables. Sin embargo, estos ejemplos plantean problemas adicionales, 
a causa de los cambios de referencia que conllevan. 
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(o, en general, con cualquier verdad necesaria), la creencia de que el agua 
es H20 constituye una asimilación de dos estructuras cognitivas diferentes 
en términos de su identidad de contenido. Si miráramos solamente a los 
contenidos de las estructuras que representan el agua y las moléculas de 
HO, sería difícil ver la forma en que la creencia de que el agua sea H20 
pudiera diferir de la creencia, digamos, de que el agua sea agua, ya que las 
estructuras que corresponden a los dos conceptos en esta creencia (agua y 
HO) tienen contenidos semánticos idénticos. Sin embargo, estas estructu- 
ras son composicionalmente distintas, de una manera que las hace distin- 
guibles funcionalmente. Su diferencia funcional reside en el hecho de que 
las dos estructuras están compuestas de unidades (estructuras cognitivas) 
funcionalmente diferentes. Creer que el agua es H20 es lograr una conver- 
gencia en las propiedades funcionales de estructuras que son ya equivalen- 
tes en términos de su contenido. 

Por esta razón, el conocimiento de una verdad necesaria, aunque no se 
requiera información para que uno lo obtenga (puesto que lo que se sabe 
tiene un informativo nulo), no es la cosa trivial, fácil, que de otra manera 
pudiera parecer. Incluso si suponemos que los petirrojos son pájaros nece- 
sariamente, es decir, que ser un pájaro sea una propiedad esencial de los 
petirrojos, el descubrimiento de que los petirrojos son pájaros puede cons- 
tituir un logro cognitivo significado. No se necesita información para hacer 
este descubrimiento, pero en la medida en que el descubrimiento implica 
saber, y el saber implica creer, sí que se necesita la creencia de que los 
petirrojos son pájaros. Y, como ya hemos visto, la adquisición de esta 
creencia no es un asunto trivial. Requiere una realineación de las propie- 
dades funcionales de varias estructuras, y puede que se necesite una inves- 
tigación para efectuar ese cambio. Puede ser necesaria la investigación, no 
para adquirir información adicional a la que uno tiene cuando posee la in- 
formación de que los objetos observados son petirrojos (pues no se puede 
obtener la información de que s es un petirrojo sin obtener la información 
de que s es un pájaro), sino para que se produzca una consolidación de las 
estructuras representativas. Es decir, la investigación puede ser necesaria 
para resolver lo que básicamente es un problema de codificación, a saber, 
el problema de determinar cuáles son (caso de haber alguna) las estructuras 
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cognitivas que codifican información que ya está codificada, o bien en su 
totalidad o bien en parte, mediante otras estructuras cognitivas.!* 

Hemos dicho que se adquieren conceptos en un conjunto óptimo de 
condiciones, óptimo, al menos, desde un punto de vista informativo. Se 
aprende lo que es un F (se adquiere el concepto F) cuando uno se ve ex- 
puesto a una multiplicidad de cosas que son F y (normalmente) de cosas 
que no son F, teniendo lugar esa exposición en condiciones en las que la 
información de que s es F, y la información de que £ no es F, se pone a 
disposición del sujeto. Se articula entonces la estructura interna que va a 
representar el que algo sea F, es decir, que va a tener este contenido se- 
mántico, en respuesta a los mensajes sobre la F-idad de las cosas. Lo que 
confiere un contenido apropiado a estas estructuras es su sensibilidad 
(desarrollada durante el aprendizaje) a un determinado componente infor- 
mativo. La sensibilidad selectiva de una estructura a la información de que 
ses F es justamente otra forma de describir el hecho de que esa estructura 
se desarrolla como una representación digital de la F-idad de las cosas en 
la clase de circunstancias característica de la situación de aprendizaje. Una 


162 No quiero decir que nuestro conocimiento de las verdades necesarias pueda identificarse 
con nuestra creencia en las verdades necesarias. Tampoco lo quiero negar. Ciertamente, la 
ecuación es una extrapolación natural de nuestra identificación del conocimiento empírico 
con creencias basadas en información, pero hay dificultades formidables para ampliar la ex- 
plicación de esta manera «natural». Francamente, no sé qué decir de nuestro conocimiento 
de las verdades que tienen un valor informativo nulo (es decir, las verdades necesarias). En 
algunos casos (por ejemplo, las verdades lógicas y matemáticas) parece que pueda ser sufi- 
ciente la mera creencia (para el conocimiento). En otros casos, no. No obstante, aparte de las 
verdades formales, están las leyes de la naturaleza. Es seguro que aquí no es suficiente la 
creencia. Sin embargo, si las leyes se conciben como verdades necesarias de algún tipo 
(donde la necesidad en cuestión se supone que sea nómica), entonces tienen también un valor 
informativo nulo. No generan ninguna información porque no hay alternativas posibles a 
ellas («posible» en el sentido de pertinente desde el punto de vista informativo). 

Por ahora no tengo nada particularmente iluminador que decir sobre estos problemas. La 
exclusión de las verdades lógicas y matemáticas (las llamadas verdades analíticas) de la pre- 
sente explicación del conocimiento no es, creo yo, una omisión seria, ya que, por lo que sé, 
todo análisis del conocimiento parece impulsado a hacer una excepción similar. Por lo tanto, 
sigo la práctica general de restringir el alcance del análisis al conocimiento empírico. Esta 
restricción está ya implícita en la restricción (véase capítulo 4) a situaciones en las que lo que 
se conoce tiene un grado positivo de información. Y mi restricción al conocimiento percep- 
tivo (en especial, al conocimiento de algún objeto dado perceptivamente que es F) excluye 
consideraciones acera de cómo se pueden conocer las leyes de la naturaleza (o si es posible 
conocerlas). 
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vez se ha formado la estructura, los especímenes subsiguientes de ella sig- 
nifican que s es F tanto si el estímulo que los ocasiona lleva esta informa- 
ción como si no. 

En el último capítulo este proceso de adquisición de un concepto pri- 
mitivo fue ilustrado describiendo el aprendizaje de lo que es un petirrojo 
por parte de un sujeto hipotético. Este no es del todo un ejemplo realista, 
puesto que la mayoría de la gente que aprende a identificar ciertos pájaros 
es ya bastante refinada conceptualmente cuando emprende esta tarea. La 
gente sabe lo que son los pájaros y lo que significa tener la capacidad de 
volar. Pueden, por lo tanto, explotar estos conceptos adquiridos previa- 
mente en su aprendizaje de lo que es un petirrojo. Por ejemplo, pueden 
mirar fotografías de petirrojos o examinar petirrojos disecados. Si ya sa- 
ben lo que es un zorzal, se les puede decir que un petirrojo es un zorzal 
que tiene el pecho de color naranja. Al adquirir el concepto de estos modos 
más o menos indirectos, no se recibe, naturalmente, información al efecto 
de que s es un petirrojo. Pero si ya se sabe lo que son un pájaro y una 
fotografía, se puede, por así decir, fabricar el concepto petirrojo a partir de 
estos recursos conceptuales adquiridos previamente y de la información 
entonces asequible. Un petirrojo es un pájaro con las manchas y la silueta 
características que se ilustran en esta fotografía. En tal caso el concepto 
se adquiere en ausencia de la información apropiada (a saber, s es un peti- 
rrojo), pero, en mi opinión, es igual de claro que no estamos en un caso de 
adquisición de un concepto primitivo. Para una persona que aprendiese lo 
que es un petirrojo en la forma indirecta descrita antes, el concepto de pe- 
tirrojo sería un concepto complejo, un concepto que tendría al concepto 
pájaro como uno de sus ingredientes. 

Supongamos, sin embargo, que enseñamos a un sujeto completamente 
lego lo que es un petirrojo. Empezamos desde el principio. Nuestro alumno 
no tiene ni el concepto de petirrojo ni el de pájaro. Si suponemos que los 
petirrojos son pájaros con una fisonomía determinada, lo suficientemente 
característica como para que se puedan reconocer sólo por su silueta y sus 
manchas, entonces sería posible enseñar a nuestro sujeto lego lo que es un 
petirrojo sin hacerle saber que los petirrojos son pájaros. Digo que sería 
posible porque si se puede saber que s es un petirrojo (que se reconoce 
como un petirrojo) basándose solamente en su silueta y sus manchas, en- 
tonces sería posible condicionar al sujeto a la información de que s es un 
petirrojo sin condicionarlo a la información de que s es un pájaro. Es decir, 
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podríamos desarrollar una estructura semántica con el contenido: x es un 
petirrojo, sin formar una estructura con el contenido: x es un pájaro. Aun 
cuando la información de que ses un pájaro esté incluida en la información 
de que s es un petirrojo (suponiendo que el ser pájaros sea una propiedad 
esencial de los petirrojos), de manera que no podamos comunicar la última 
información sin comunicar la primera, podemos, sin embargo, formar una 
estructura que codifique digitalmente la primera. Aunque nuestro sujeto 
esté recibiendo (necesariamente) la información de que s es un pájaro 
mientras adquiere el concepto de petirrojo (en virtud de que esto está in- 
cluido en la información de que s es un petirrojo), no digitaliza esta infor- 
mación. Mediante un cuidadoso programa de refuerzos logra digitalizar 
sólo la información más específica. Como resultado de ello, adquiere el 
concepto de petirrojo sin adquirir el concepto de pájaro. De ocurrir esto, 
el sujeto podrá creer acerca de determinados pájaros que son petirrojos sin 
creer e incluso sin estar capacitado para creer —puesto que carece del 
concepto pertinente— que son pájaros. 

Esta consecuencia concreta de una caracterización de los conceptos ba- 
sada en la teoría de la información puede parecerles paradójica a algunos 
lectores. Pero la consecuencia no sólo no es paradójica, sino que ilumina 
un hecho importante relativo a la naturaleza de los conceptos, una carac- 
terística de los conceptos (o significados) que se ha aclarado recientemente 
a raíz de los trabajos de Saúl Kripke, Hilary Putnam y otros.!”% Se puede 
tener el concepto F, o bien —si a uno no le agrada hablar de conceptos— 
la creencia de que esto es F, sin conocer todas las propiedades esenciales 
de F (incluso sin conocer ninguna). Se puede tener el concepto de peti- 
rrojo, y creer por lo tanto que el ser que está posado en aquella rama es un 
petirrojo, sin saber lo que es esencial para que algo sea un petirrojo; sin 
saber que los petirrojos pueden volar o que son pájaros. En realidad esto 





170 Véase, por ejemplo, S. Kripke, «Naming and Necessity», Semantics of Natural Lan- 
guage, Donald Davison y Gilbert Harman (eds.), D. Reidel, Dordrecht, Holanda, 1972, págs. 
253-355; Hilary Putnam, «The Meaning of Meaning», Mind, Language and Reality, Philo- 
sophical Papers, vol. 2, Cambridge University Pres, Cambridge, 1975, págs. 215-271 [pri- 
mera publicación en K. Gunderson (ed.) Language, Mind and Knowledge, Minnesota Studies 
in the Philosophy of Science Vil, University of Minnesota Press, Minneapolis, 1975]. Véase 
también Dennis Stampe, «On the Meaning of Nouns», Limiting the domain of Linguistics, D. 
Cohén (ed.), Milwaukee, 1972, págs. 54-71. 
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es lo que hace posible creer que algo es un petirrojo y sin embargo necesi- 
tar una investigación empírica para descubrir lo que son los petirrojos. Uno 
no tiene que saber todo, o nada, de lo que es esencial para que algo sea oro 
para creer que ha encontrado oro. Si esto fuera necesario (suponiendo que 
la única candidata plausible a propiedad esencial del oro sea su constitu- 
ción atómica), entonces los buscadores de oro californianos de anteriores 
generaciones no sólo no supieron que habían encontrado oro, sino que in- 
cluso no lo creyeron. 

La posesión de un concepto es algo bastante diferente del conocimiento 
de las condiciones que se pueden considerar necesarias, y conjuntamente 
suficientes, para la aplicación del concepto. Se puede tener un concepto y 
tener todavía mucho que aprender sobre las cosas a las que se aplica; mu- 
cho que aprender sobre lo que es necesario para que una cosa sea una ejem- 
plificación del concepto. No podemos seguir aceptando por más tiempo la 
idea tradicional de que la tarea de la ciencia es descubrir las propiedades 
accidentales de las cosas mientras que la tarea del análisis lingiñístico o 
conceptual es revelar las propiedades esenciales de las cosas. Lo que he- 
mos averiguado es algo totalmente diferente. Al analizar el concepto de C 
que tiene un determinado sistema podemos no encontrar ninguna repre- 
sentación cognitiva de las propiedades esenciales de C. La distinción entre 
lo que se puede saber a priori (mediante alguna forma de análisis concep- 
tual) acerca de un tipo de cosa y lo que es necesario (esencial) para que 
una cosa sea de ese tipo es una distinción que ha efectuado con la máxima 
credibilidad Saúl Kripke en sus conferencias sobre el nombrar y la necesi- 
dad (ver nota 4). La originalidad del presente análisis (caso de que la hu- 
biera) no estriba en esa distinción entre las propiedades esenciales de un F 
y lo que se puede saber de alguna forma a priori (por la vía de un análisis 
conceptual) sobre las cosas que son F, sino en la idea de que la diferencia 
que esta distinción registra es una diferencia que se origina en la naturaleza 
informacional del significado (de los conceptos). 


El origen informacional de los conceptos 


He argumentado que para la formación de un concepto primitivo es 
necesario que el sistema (para el cual el concepto es primitivo) sea capaz 
de recibir, y que haya recibido de hecho (durante el aprendizaje), la clase 
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adecuada de información. Se dijo que esto era necesario para el desarrollo 
de la estructura semántica apropiada. He aplazado varias objeciones a esta 
tesis para tener una imagen más completa del marco conceptual que se 
estaba desarrollando y ofrecer al lector una mejor idea del mismo. Pero ya 
es hora de afrontar esas dificultades. Sin embargo, no puedo esperar de- 
fenderme contra toda objeción pertinente. Hay aquí algunas dificultades 
que no van a desaparecer. Con todo, al discutir los que a mi entender son 
los problemas más importantes de este enfoque, espero aclarar hasta dónde 
se puede llegar en la clarificación de la naturaleza de los conceptos y el 
fenómeno asociado del significado. 

Antes de empezar, se debería recordar que, al menos por el momento, 
estamos tratando sólo de los conceptos primitivos. Un concepto primitivo 
requiere que el sistema que lo posea tenga la capacidad de recibir, y de 
hecho que haya recibido ya, la información correspondiente al significado 
de ese concepto (su contenido semántico). Por supuesto, esto no vale para 
los conceptos complejos. Es bastante obvio que alguien pueda creer que s 
es un fantasma, un milagro o un unicornio sin haber recibido jamás la in- 
formación de que algo sea un fantasma, un milagro o un unicornio. Si tales 
cosas no existen (y no han existido nunca), nadie ha recibido jamás esas 
informaciones. Afirmo, sin embrago, que tales conceptos son siempre 
complejos, que se forman a partir de estructuras cognitivas elementales.!”! 
Dado que no voy a argumentar esta afirmación, espero que sea lo suficien- 
temente plausible como para no necesitar un argumento. Puesto que su- 
pongo que debe haber algunos conceptos primitivos (y que los conceptos 
con extensión nula no están entre ellos), limitaré mi atención a conceptos 
que podrían plausiblemente considerarse primitivos para algún organismo 
en algún momento.!”? La tesis sobre la necesidad de antecedentes infor- 
mativos es una tesis sobre estos conceptos. 





171 Una vieja idea empirista con un nuevo traje (es decir, diseñado con la teoría de la infor- 
mación). «Pero aunque nuestro conocimiento parece poseer esta libertad limitada, hallaremos 
con un examen más profundo que realmente está confinado dentro de límites muy estrechos, 
y que todo este poder creativo de la mente no equivale más que a la facultad de componer, 
transponer, aumentar o disminuir los materiales que nos son proporcionados por los sentidos 
y la experiencia. Cuando pensamos en una montaña dorada, combinamos tan sólo dos ideas 
consistentes, «oro» y «montaña», con las que estábamos familiarizados con anterioridad.» 
David Hume, An Inquiry Concerning Understanding, sección Il. 


172 Por ejemplo, el programa de P. H. Winston pare reconocer mesas, arcos, columnas y 
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Aparte, pues, del recurso encubierto a conceptos complejos, existe un 
tipo de situación de aprendizaje en la cual alguien puede concebir que un 
organismo adquiriría un concepto primitivo sin la clase de información 
necesaria. La idea es la siguiente: enseñarle a alguien el concepto de rojo 
mostrándole objetos blancos bajo una luz roja;'”* o bien enseñarle a al- 
guien lo que es un petirrojo mostrándole copias mecánicas ingeniosas que 
píen y vuelen exactamente igual que los petirrojos reales. Puesto que al 
sujeto no se le muestra nada que sea rojo (o, respectivamente, nada que sea 
un petirrojo), no va a recibir la información de que algo es rojo (o, respec- 
tivamente, que es un petirrojo), ni desarrollará una respuesta selectiva a tal 
información. Por tanto, no se desarrollará ninguna estructura que tenga el 
contenido semántico «x es rojo» o «x es un petirrojo». Y, sin embargo, 
puede replicarse, se podría adquirir el concepto rojo o el de petirrojo de 
esta forma tan poco ortodoxa. Una vez acabado el período de aprendizaje, 
desaparecerán las circunstancias anormales y nuestro sujeto se confundirá 
con el resto de nosotros. Si ha aprendido bien la lección, describirá (bajo 
iluminación normal) los objetos rojos como rojos y retirará esta descrip- 
ción ante objetos de diferente color. O bien, si ocurriera que el sujeto fuera 
una paloma, el ave en cuestión cogería con el pico los pedacitos rojos (bajo 
iluminación normal) y rehusaría hacerlo con los pedacitos de otros colores. 
Incluso en circunstancias anormales —la clase de circunstancias que ca- 
racterizaban la situación de aprendizaje para el sujeto entrenado de manera 
no usual — no habrá ninguna diferencia aparente, toda vez que, suponiendo 
que ninguno se da cuenta de la anormalidad, tanto el sujeto entrenado nor- 
malmente como el sujeto entrenado de manera no usual describirán ambos 
los objetos blancos (bajo luz roja) como rojos. Por lo tanto, parece que si 





bóvedas utiliza conceptos más primitivos (como ladrillos, cuñas y pilares), con los que cons- 
truye una descripción estructural del objeto-estímulo; véase el análisis de este programa de 
Margaret Boden en Artificial Intelligence and Natural Man, Basic Books, Nueva York, 1977, 
págs. 252 y ss. Sin algunos conceptos primitivos (incluso sin los elementos como línea, án- 
gulo y juntura) el programa no sería capaz de construir ninguna estructura cognitiva más 
compleja. 


173 Es importante que los objetos blancos (que han de parecer rojos) sean iluminados selec- 
tivamente con luz roja de tal manera que los objetos circundantes no se iluminen de igual 
modo. El no observar esta precaución podría desencadenar un mecanismo de constancia en 
el sistema perceptivo del sujeto que los mira de manera que los objetos blancos (aunque re- 
flejen luz roja) no parecerían rojos. 
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hemos de conceder la posesión del concepto rojo a los sujetos que apren- 
dieron normalmente, igual debe concedérsele al sujeto que aprendió de 
manera inusual. Esto, sin embargo, contradice la tesis que se está defen- 
diendo: nuestro sujeto no adquirió el concepto en respuesta a la informa- 
ción sobre el color de los objetos. Lo hizo en respuesta a una información 
errónea. 

Lo primero que se debe hacer notar sobre este ejemplo es que la palabra 
que se enseña a usar al sujeto en respuesta a las cosas en apariencia rojas 
no tiene importancia alguna. Cuál sea la palabra que se use para expresar 
lo que uno cree no es pertinente para valorar lo que alguien cree efectiva- 
mente (aunque en situaciones normales ésa es ciertamente una informa- 
ción pertinente). No estamos ahora preguntando lo que significa la palabra 
«rojo». Preguntamos qué concepto o creencia expresa el sujeto que apren- 
dió de forma no usual al usar esta palabra. Le podríamos haber enseñado 
a decir «hexagonal». Pero esto no mostraría que, al describirlos como «he- 
xagonales», creía que ciertos objetos rojos (en apariencia) eran hexagona- 
les. 

Hay algo que parece claro: el concepto que tiene realmente nuestro su- 
jeto (después de esa clase de aprendizaje) no puede ser el concepto rojo si 
lo aplica correctamente a cosas que no son rojas. Puesto que esto es así, 
podremos mostrar que nuestro sujeto no tiene el concepto rojo si podemos 
mostrar que el concepto que realmente tiene se aplica correctamente a los 
objetos blancos con los que aprendió. 

Sea R el concepto que el sujeto realmente ha adquirido durante el pe- 
ríodo de aprendizaje descrito antes, es decir, el concepto que expresa la 
palabra «rojo» que ahora usa. La cuestión es entonces si los objetos blan- 
cos (bajo luz roja) que a él se le mostraron durante el aprendizaje son real- 
mente R. 

Cuando el sujeto responde «rojo» a estos objetos blancos —algo que 
él ha aprendido a hacer— su respuesta es obviamente incorrecta en el sen- 
tido de que esa respuesta implica el uso de una palabra que, dado su signi- 
ficado en el lenguaje público del que forma parte, no se aplica a los objetos 
a los que el sujeto la está aplicando. Pero cuando valoramos la corrección 
o incorrección de la respuesta, no nos está permitido que usemos este he- 
cho, ya que entonces estamos tratando de determinar cuál es el concepto 
que expresa la palabra que usa el sujeto, lo que éste quiere decir con la 
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palabra «rojo», y no podemos suponer que éste sea el concepto de rojo sin 
circularidad. 

¿Qué podría significar, entonces, decir que los objetos blancos que se 
utilizaron para el aprendizaje (bajo luz roja) no eran R? Esto sólo podría 
tener sentido si suponemos que había criterios para la correcta aplicación 
de R que eran independientes de los que el sujeto había aprendido a usar; 
es decir, sólo si suponemos que la respuesta (o el estado interno que la 
provoca) tiene un significado independiente del que adquiere en la situa- 
ción de aprendizaje. Pero, si dejamos a un lado el significado convencional 
de la palabra «rojo», esto es precisamente lo que no tiene sentido. Es pre- 
cisamente la información a la cual se hace responder al sujeto en la situa- 
ción de aprendizaje la que define lo que constituye una respuesta correcta, 
y no, por supuesto, para las palabras que se enseña a proferir al sujeto 
(pues éstas son parte de un lenguaje público con criterios independientes 
de aplicación), sino para los conceptos (si los hubiere) que aquél expresa 
con esas palabras. Hasta que el sujeto no ha adquirido el concepto R, no 
hay respuesta que constituya una aplicación correcta de ese concepto, 
puesto que ninguna respuesta constituye una aplicación de tal concepto. Y 
una vez ha adquirido el sujeto el concepto R, la cuestión de cuál sea el 
concepto adquirido, y, por tanto, la cuestión de qué es lo que constituye 
una aplicación correcta de ese concepto, la determinan las propiedades 
para representar las cuales se formó el concepto. De ahí que no tenga sen- 
tido suponer que cuando al sujeto se le enseña a responder «rojo» ante 
objetos blancos que parecen rojos, se le esté enseñando a aplicar incorrec- 
tamente un concepto a estos objetos. Lo que se le está enseñando a hacer 
incorrectamente es usar la palabra «rojo» para expresar el concepto que él 
aplica. 

Querría decir, pues, que el sujeto al que se ha enseñado del modo no 
usual no tiene el concepto rojo. A lo sumo tiene el concepto parecer rojo 
o, quizás, algún concepto que se aplica indiferentemente tanto a las cosas 
que son rojas como a las que parecen rojas (suponiendo que el concepto se 
aplica, si es que en verdad se aplica, al objeto perceptivo s). El hecho de 
que exprese ese concepto con la palabra «rojo» y el hecho de que normal- 
mente actúe en condiciones de iluminación usuales (en las que los objetos 
blancos no parecen rojos) explica la dificultad de detectar su excéntrico 
concepto y las creencias correspondientes. Pero la dificultad que hay en 
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descubrir esta anomalía conceptual no se debería confundir con la posibi- 
lidad bien diferente de que exista tal anomalía conceptual. 

Esta misma observación se puede hacer de un modo más espectacular 
utilizando un ejemplo de Hilary Putnam.!”* Supongamos que existe un lu- 
gar (llamémosle la Tierra Gemela) en el que hay dos sustancias XYZ y 
HO, bastante diferentes desde un punto de vista químico, pero que tienen 
ambas las propiedades superficiales del agua. Por propiedades «superfi- 
ciales» se entiende las propiedades con las que corrientemente contamos 
(fuera del laboratorio) para identificar algo como agua. Algunos de los la- 
gos y ríos de la Tierra Gemela son de H20; otros de XYZ. De los grifos de 
algunas casas sale H20; de los de otras, XYZ. En algunas partes del país 
llueve H20, en otras, XYZ. En algunos lugares hay mezcla de las dos sus- 
tancias. Los habitantes de la Tierra Gemela llaman a ambas sustancias 
«agua», puesto que son indistinguibles (si no se tiene en cuenta un análisis 
químico refinado). Las dos quitan la sed, tienen el mismo sabor, hierven y 
se hielan a la misma temperatura (o casi), etc. 

Consideremos ahora que algún habitante de la Tierra Gemela (Ilamé- 
mosle Tommy) se le ha enseñado lo que es el agua en una parte de la Tierra 
Gemela en la que había tanto H20 como XYZ. Resulta, sin embargo, que 
(de un modo totalmente accidental) se le ha enseñado a identificar el agua 
(o lo que los habitantes de la Tierra Gemela llaman «agua») exponiéndo- 
sele únicamente al H20. Después de aprender lo que es el agua (para com- 
pleta satisfacción de sus maestros), emigra a una parte de la Tierra Gemela 
donde únicamente se puede encontrar H20. O bien (para formular este 
punto en términos aún más claros) podemos suponer que Tommy es trans- 
portado milagrosamente a la Tierra, donde sólo hay H20. Puesto que no 





174 He adaptado el ejemplo de Putnam para mis propios fines. Su ejemplo de la Tierra Ge- 
mela se puede encontrar en «The Meaning of Meaning» loe. cit. Putnam usa el ejemplo para 
argumentar que los significados no están en la cabeza: las propiedades intrínsecas de nuestros 
estados internos no determinan las extensiones (ni, por lo tanto, los significados) de cuales- 
quiera conceptos que pueda considerarse que estos estados internos representan. Yo llego a 
la misma conclusión desde una perspectiva distinta. Puesto que dos estructuras físicamente 
diferentes pueden tener el mismo contenido semántico, el significado de estas estructuras 
(cuáles sean los conceptos que tiene el sistema) no se encuentra en las propiedades intrínsecas 
(físicas) de las estructuras. Los significados no están en la cabeza; están «en» en el sistema 
de dependencias nómicas que define las características de respuesta-información de las es- 
tructuras que hay en la cabeza. 
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hay ninguna diferencia entre la Tierra Gemela y la Tierra, Tommy se ha- 
bitúa a ésta sin ningún problema. Todo lo que Tommy dice sobre el agua 
(usando la palabra «agua») se corresponde con lo que sus nuevos amigos 
dicen y creen sobre el agua (usando igualmente la palabra «agua»). 

La cuestión es, naturalmente, no lo que Tommy dice, sino lo que 
Tommy cree. Tommy no tiene el mismo concepto que sus amigos terríco- 
las. Lo que Tommy cree cuando dice «Esto es agua», no es lo que creen 
sus amigos terrícolas cuando dicen «Esto es agua». Lo que la palabra 
«agua» quiere decir, en boca de Tommy, es cualquiera de las dos cosas, 
H20 o XYZ. Por supuesto, así es como nosotros, que conocemos todos los 
detalles del caso, lo describiríamos, no como lo haría Tommy. Si le pre- 
guntamos, Tommy dirá que al usar la palabra «agua» quiere decir agua, y 
no hay duda de que eso es lo que quiere decir. Pero la cuestión está en que 
para Tommy cuentan como agua más cosas que para sus amigos terrícolas. 
Si imagináramos que de repente se transporta también a la tierra algo de 
XYZ, la creencia de Tommy, acerca de esa sustancia, de que se trata de 
agua sería verdadera, mientras que la creencia de sus amigos terrícolas de 
que es agua sería falsa. 

Una explicación de esta diferencia que se base en una teoría de la in- 
formación habrá de encontrarse en la diferencia que haya en la clase de 
información recibida por Tommy y sus amigos terrícolas durante sus res- 
pectivos períodos de aprendizaje. Aunque resulta que, de modo totalmente 
accidental, Tommy y sus amigos terrícolas se vieron expuestos a la misma 
sustancia en el período de aprendizaje (a saber, H20), la información de 
que esa sustancia era H20 estaba a disposición de los terrícolas, pero no 
de Tommy.!”* En la Tierra Gemela esta información no estaba disponible 
porque allí (al revés que en la Tierra) las señales llevaban la información, 
no de que s era H20, sino de que s era cualquiera de las dos cosas, H20 o 
XYZ. Tommy, durante el aprendizaje, recibió de modo selectivo esta úl- 
tima información (esencialmente disyuntiva). Puesto que no se puede en- 
contrar XYZ en la Tierra (y, según estamos suponiendo, no se puede traer 
a la Tierra si no es de forma milagrosa), los terrícolas adquieren un con- 
cepto diferente porque fue una información distinta la que configuró sus 





175 Decir que esta información estaba a disposición de los terrícolas es, por descontado, 
suponer que el que el líquido fuera XYZ no era una posibibilidad (pertinente) para los terrí- 
colas (como lo fue para Tommy en la Tierra Gemela). 
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respuestas discriminatorias: a saber, la información de que eso era H20. 
Dado que las regularidades existentes en esos dos mundos son diferentes, 
la clase de información que se puede encontrar en señales físicamente in- 
distinguibles es diferente. Por lo tanto, el contenido semántico de las es- 
tructuras que se desarrollan como respuesta a estas señales es también di- 
ferente. Esta es la razón de que el concepto de Tommy, aunque se formara 
como respuesta al mismo tipo de estímulos físicos (el que asociamos con 
ver, saborear y sentir el agua), y aunque se formara (de hecho) asociado a 
la misma sustancia (H20), es claramente distinto del concepto de los terrí- 
colas. Ambos usan la misma palabra para expresar lo que quieren decir, 
pero lo que expresan es distinto. Como mínimo tienen conceptos con ex- 
tensiones diferentes. 

No hay forma de descubrir esta diferencia mirando «dentro de sus ca- 
bezas», es decir, examinando las propiedades físicas de sus estados inter- 
nos, toda vez que las distintas extensiones (y, por tanto, los conceptos dis- 
tintos) resultan de la clase diferente de información a la que se vieron ex- 
puestos durante el aprendizaje, y esta diferencia no es una diferencia en lo 
que hay en sus cabezas, sino una diferencia en las regularidades informa- 
cionalmente relacionadas que dominaban el entorno en el que aprendie- 
ron.!?$ 

Se puede juzgar de excesivamente fantasioso el ejemplo de Putnam. 
Yo he visto rechazarlo por tener poco o nada que ver con la manera en que 
nosotros formamos conceptos o con la aplicación de los conceptos que 
tenemos. Esto es un error. El ejemplo tiene un sabor de ciencia ficción 
poco afortunado, pero la moraleja que lleva consigo es bien práctica. Nos 
dice que no se puede adquirir el concepto F viéndose expuesto a señales 
que llevan únicamente la información de que las cosas son Fo G. O bien, 
para formular la misma observación en términos de la teoría de la infor- 
mación, la clase de información disponible en las señales a las que uno 





176 Putnam señala (pág. 241) que si la sustancia XYZ se encontrara en la Tierra, entonces 
sería agua. La razón por la que entonces sería agua es que lo que nosotros (los terrícolas) 
diríamos al decir que algo es agua habría variado. Es decir —en términos de la forma en que 
he adaptado el ejemplo de Putnam—, que si hubiera XYZ en nuestros lagos y ríos (junto con 
H20), entonces habríamos formado un concepto como el de Tommy, un concepto que tendría 
tanto H20 como XYZ en su extensión. Si XYZ fuese tan omnipresente en la Tierra como lo 
es en la Tierra Gemela, entonces sería agua, no lo que ahora llamamos agua (puesto que, 
probablemente, incluye sólo H20), sino lo que entonces habríamos llamado agua. 
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desarrolla una respuesta selectiva limita los conceptos (primitivos) que se 
adquieren, y la identidad de los conceptos adquiridos de ese modo está 
determinada por esa información. 

Así, por ejemplo, si no hay otros pájaros que se parezcan y que canten 
exactamente igual que los petirrojos, en ese caso puedo aprender lo que es 
un petirrojo mirando y escuchando a los petirrojos. Probablemente así es 
como las cosas son en nuestro mundo. Pero si hubiera otros pájaros (o ré- 
plicas mecánicas) que fueran, en condiciones normales de visión y audi- 
ción, indistinguibles de los petirrojos genuinos, entonces lo que se adqui- 
riría mirando y escuchando a los petirrojos no sería el concepto de peti- 
rrojo. Sería un concepto más amplio, es decir, algo cuya extensión abar- 
caría a esos otros pájaros (o a las réplicas mecánicas). Y esta diferencia 
conceptual es resultado de la diferencia entre estos mundos desde el punto 
de vista de la información: en el último de ellos (aunque, probablemente, 
no en el nuestro) no se obtendría la información de que aquel pájaro es un 
petirrojo mirando y escuchando de forma casual. 

La situación de Tommy en la Tierra es idéntica a la de nuestro sujeto 
hipotético, el que aprendió a responder «rojo» ante objetos blancos que 
parecían rojos, una vez que éste sale del ámbito artificial en que se efectuó 
el aprendizaje. Él no tiene el concepto de rojo. Lo que tiene es un concepto 
que aplica a aquellos objetos blancos con los que aprendió. El concepto de 
Tommy, el que él expresa con la palabra «agua», se aplica a cosas que no 
son agua (es decir, que no son H20, no lo que nosotros entendemos por 
agua); y el concepto de nuestro sujeto, el que él expresa con la palabra 
«rojo», se aplica a cosas que no son rojas. El hecho de que sus respuestas 
verbales ante objetos rojos iluminados normalmente sean tan apropiadas y 
tan discriminativas como las de los sujetos que aprendieron normalmente 
no dice absolutamente nada sobre cuál es el concepto que está aplicando 
cuando dice que un objeto es «rojo». Todo lo que esto muestra es (como 
en el caso de Tommy) que resulta que él está actuando en un entorno —o 
en condiciones— en que el concepto que él realmente tiene es coextensivo 
con el que tienen sus semejantes. 

No se debería entender que esta discusión implica que no se puede ad- 
quirir el concepto de rojo como un concepto primitivo cuando a uno se le 
presentan objetos de varios colores, al modo como se enseña a la mayoría 
de los niños los nombres de los colores. No significa que no podamos, por 
decirlo así, usar el hecho de que las cosas parezcan rojas para enseñar a 
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alguien lo que significa ser rojo. Lo que realmente significa es que, para 
adquirir el concepto de rojo como concepto primitivo, uno debe actuar en 
circunstancias más o menos normales, circunstancias en las que el que s 
parezca rojo lleva la información de que s es rojo. Para desarrollar la es- 
tructura semántica requerida, una estructura que tenga un contenido expre- 
sable como «x es rojo» (en contraste con «x parece rojo»), será necesario, 
naturalmente, hacer que el sujeto sea sensible a la información sobre el 
color del que son las cosas y no precisamente sobre el color del que pare- 
cen ser. Esto, sin duda, requerirá entrenamiento en una gran variedad de 
condiciones de iluminación (por ejemplo, con luz sola, al anochecer o con 
luz artificial) y en una gran variedad de contextos (por ejemplo, fondos de 
distinto color). El hecho de que con posterioridad pueda engañarse a tal 
sujeto (el que ha aprendido normalmente) haciéndole pensar (utilizando 
una iluminación selectiva con luz roja) que ciertas cosas son rojas, cuando 
lo único que pasa es que parecen rojas, no muestra que realmente tenga el 
concepto parecer rojo en vez del concepto rojo. Por lo mismo se podría 
argumentar también que alguien no tiene el concepto petirrojo porque po- 
dría ser engañado por una ingeniosa réplica mecánica o que un niño no 
tiene el concepto de distancia porque piensa que la Luna está bastante 
cerca, a su alcance.!”” 

Una consecuencia de este análisis (que ya se señaló con anterioridad) 
es que cuando C es un concepto primitivo, no puede tener una extensión 
vacía. Debe aplicarse (o se ha aplicado) a algo, aunque sólo sea a los ob- 
jetos disponibles en el período en que se estaba adquiriendo el concepto. 
Además, si C es primitivo para K, K debe haber recibido información con 
respecto a que algo era C. Todo esto es consecuencia de nuestra caracteri- 
zación del modo en que se adquieren los conceptos primitivos.!”* Tiene 
además una consecuencia epistemológica sorprendente. Si C es un con- 
cepto primitivo, uno no puede creer que s sea C a no ser que esté (o estu- 
viera) bien dotado para saber que las cosas eran C. En efecto, nadie puede 
creer que s sea C a menos que tenga el concepto C. Por otro lado, nadie 





177 Por supuesto, el sujeto puede adquirir el concepto rojo como un concepto complejo. Por 
ejemplo, podría desarrollar el concepto: parece rojo en condiciones C, donde C se refiere a 
las condiciones —por ejemplo, luz solar— en que las cosas que parecen rojas son rojas. 


178 Hablando técnicamente, estas observaciones se deberían restringir a los conceptos ad- 
quiridos (aprendidos). Más adelante tendré algo más que decir sobre conceptos innatos. 
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puede adquirir este concepto a menos que reciba, procese y codifique la 
información sobre la C-idad de las cosas; es decir, a no ser que desarrolle 
un medio de codificar digitalmente la información sobre la C-idad de las 
cosas. Ahora bien, puesto que el conocimiento ha sido identificado con 
creencias que producen información, cualquier organismo capaz de creer 
que algo es C debe tener (o haber tenido) suficientes recursos de proceso 
de información como para saber que las cosas son (o eran) C. Sin esta 
capacidad, un organismo nunca podría haber desarrollado el concepto C, 
y, por lo tanto, nunca podría tener creencias en relación a que algo fuera 
C. 

La fórmula clásica (conocimiento = creencia verdadera justificada) nos 
asegura que el conocimiento requiere creencia. Parece ahora, sin embargo, 
que algunas creencias (aquellas que implican conceptos primitivos) re- 
quieren, si no conocimiento, al menos la posibilidad del conocimiento por 
parte del sistema que tiene las creencias. Lo dañina que esta consecuencia 
sea para la tesis escéptica tradicional dependerá, naturalmente, de la can- 
tidad de creencias que uno tenga que impliquen conceptos primitivos. Pero 
hay algo que puede afirmarse con seguridad: la opinión de que nada puede 
saberse es falsa y puede demostrarse. Su demostración requiere (además 
de la aceptación de la presente concepción de la creencia y el conoci- 
miento) sólo la premisa de que tenemos creencias. Por lo que sé, la mayoría 
de los escépticos no han puesto en duda esta premisa. 

Probablemente, la mayoría de los conceptos que empleamos en la des- 
cripción de nuestro entorno son conceptos complejos, estructuras que se 
construyen de varias formas a partir de elementos más primitivos. Si C¡ es 
una estructura primitiva que tiene el contenido rojo y C, es una estructura 
primitiva que tiene el contenido cuadrado, puede concebirse el concepto 
de un cuadrado rojo como una estructura compuesta que tiene C¡ y C2 
como componentes. Naturalmente, las reglas que determinan la formación 
de conceptos complejos, la sintaxis de este lenguaje interno, no pueden ser 
tan simples como lo que sugiere este ejemplo. Los conceptos: 1) rojo y 
cuadrado, 2) rojo o cuadrado, 3) rojo sólo si cuadrado, y 4) rojo, pero no 
cuadrado, son todos conceptos diferentes, pero todos tienen como consti- 
tuyentes rojo y cuadrado. Son, por así decir, elaborados con los mismos 
ingredientes (semánticos) según diferentes recetas (sintácticas). La sinta- 
xis de este lenguaje interno, la clase de mecanismos de composición res- 
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ponsables de la formación de conceptos complejos, debe ser extremada- 
mente compleja si es que ha de dar cuenta de la variedad y la sutileza que 
encontramos en un sistema maduro de conceptos. Por supuesto, esto es 
verdad especialmente cuando dirigimos nuestra mirada a los organismos 
que usan lenguaje. Realmente, apenas parece una metáfora hablar de los 
mecanismos internos de composición responsables de la generación de 
conceptos complejos como si constituyeran ellos mismos un lenguaje, el 
lenguaje del pensamiento.!”? Pero esto, a su vez, puede ser solamente un 
reflejo del hecho de que los mecanismos conceptuales internos son, en 
parte al menos, una internalización de los recursos de composición y pro- 
yección inherentes al lenguaje público que aprendemos. Aprendemos re- 
cetas más sutiles para la construcción de conceptos complejos a medida 
que aprendemos el lenguaje porque (quizá) las recetas para elaborar estos 
conceptos complejos nos las proporciona la red de respuestas (y discrimi- 
naciones) cada vez más ricas y diferenciadas que la adquisición del len- 
guaje implica. Al adquirir un lenguaje, nos proveemos de un sistema más 
rico de estados internos distinguibles por su capacidad representativa, y 
esto, como hemos visto, es la esencia del desarrollo conceptual. '$% 

Estos temas son demasiado técnicos para que los analicemos aquí. Al 
menos desbordan mi competencia técnica. Es mejor que las cuestiones que 
tienen que ver con la formación de conceptos, especialmente si se refieren 
al modo en que los usuarios del lenguaje son capaces de generar conceptos 





173 He tomado prestada la metáfora «lenguaje del pensamiento» de The Language of 
Thought de Jerry Fodor, Thomas Y. Crowell Company, Nueva York, 1975. 


180 La adquisición del lenguaje hace posible el desarrollo de un sistema conceptual más rico, 
al menos en parte, porque los usuarios del lenguaje se apoyan cada vez más en el propio 
lenguaje para la transmisión de información. Es decir, buen parte del trabajo de la digitaliza- 
ción, fundamental para el proceso de formación de conceptos, está ya completo, incorporado 
en el lenguaje público que el individuo absorbe de sus semejantes. Así, por ejemplo, obtener 
la información de que s es un árbol sin obtener ninguna información más específica sobre s 
(por ejemplo, que s es un arce, un árbol alto, un árbol con hojas) es comparativamente fácil 
cuando esta información llega en forma lingúística (ya que el lenguaje por el que llega es ya 
una forma digital de codificar esta información), pero no es tan fácil cuando la información 
llega en forma perceptiva (es decir, viendo un árbol). Por eso, buena parte del trabajo de un 
individuo en la formación de una red de conceptos está ya acabado cuando crece en una 
comunidad que comparte un lenguaje. El lenguaje público es un depósito de los hallazgos 
conceptuales de nuestros antepasados, y cada individuo se aprovecha de este depósito al 
aprender el lenguaje. 
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más complejos a partir de otros ya existentes, se dejen para los especialis- 
tas capaces de estudiarlas. Para mis limitados propósitos, basta señalar que 
un lenguaje tiene tanto una sintaxis como una semántica. Y sea la sintaxis 
de ese lenguaje interno la que fuere, el objetivo de este último capítulo ha 
sido suministrar una primera explicación a grandes rasgos del modo en que 
este lenguaje interno (conjunto de estructuras internas con significado) ad- 
quiere su significado o interpretación, es decir, de cómo obtiene su semán- 
tica. He argumentado que nuestros estados internos adquieren su signifi- 
cado en función de la información a la cual venía a responder su confor- 
mación original en unidades funcionales. Es la información expresada en 
estos estímulos originales, formativos, la que suministra el contenido a 
esas estructuras internas, un contenido que estas estructuras conservan in- 
cluso cuando más tarde se actualizan mediante estímulos que carecen de 
la información pertinente. 


Conceptos innatos 


He hecho hincapié en la situación de aprendizaje porque, hablando en 
general, es aquí donde tiene lugar el emparejamiento o coordinación entre 
información y función característicos de los conceptos. Es típicamente en 
la situación de aprendizaje cuando los organismos desarrollan estados in- 
ternos con un contenido semántico distintivo. A pesar de tal énfasis, existe 
la posibilidad de que un organismo pueda llegar a este mundo «sintoni- 
zado» ya con ciertas unidades de información, sin necesidad de ningún 
aprendizaje. El organismo está preprogramado, por así decir, con un con- 
junto de estados internos que son sensibles de modo selectivo a ciertas 
informaciones que se reciben en la percepción y que contribuyen a confi- 
gurar la conducta. Las exigencias de la supervivencia han llevado a la se- 
lección de individuos con medios cognitivos para responder, selectiva- 
mente, a ciertas informaciones vitales obtenidas en el entorno. Algunas de 
éstas se digitalizan automáticamente para determinar respuestas importan- 
tes (ocultación, huida, persecución, encubrimiento, etc.). En virtud de esta 
coordinación o emparejamiento heredado entre las estructuras funcional- 
mente significativas y su sensibilidad informativa, tales estructuras tienen 
un significado o contenido anterior a cualquier exposición real a las seña- 
les que llevan la información pertinente. Naturalmente, estamos hablando 
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de los conceptos innatos: estructuras internas significativas que, anteriores 
al aprendizaje, con anterioridad a la exposición a señales que llevan la in- 
formación de que s es C, constituyen el modo en que el sistema representa 
digitalmente el hecho de que algo sea C. 

El que un organismo tenga conceptos innatos y, si así ocurriera, el que 
puedan ser identificados con los conceptos que posee en su estado com- 
pletamente maduro, son cuestiones empíricas. Estas son precisamente las 
que han separado durante largo tiempo a los innatistas y los empiristas en 
psicología evolutiva. No deseo tomar partido en esta controversia. Pero 
para ilustrar el modo en que se suscita este tema tradicional cuando se re- 
formula en el lenguaje de la presente teoría de la información, vamos a 
referirnos a uno de los estudios recientes más notables sobre percepción 
de la profundidad. Los experimentos de Gibson y Walk con el precipicio 
visual sugieren que toda una serie de animales (entre ellos el ser humano) 
tienen un concepto de profundidad que se manifiesta muy pronto. !*! 
Cuando se los expone a un precipicio visual (información acerca de un 
rápido aumento de la distancia hacia abajo) los pollos, las tortugas, las ra- 
tas, los cabritos, los cerdos, los gatos y los perros de muy corta edad ma- 
nifiestan una reacción notablemente similar. «Cuando el pollito tiene me- 
nos de 24 horas se le puede someter a la prueba del precipicio visual. 
Nunca (el énfasis es mío) comete un “error” y siempre baja de la mesa por 
el lado poco profundo.'*2, Además: 


A los cabritos y los corderos, como a los pollos, se les puede someter a la 
prueba del precipicio visual en cuanto se puedan tener en pie. La respuesta de estos 
animales es fácilmente predecible. Ninguna cabra o cordero pisó el cristal del lado 
profundo, aun cuando sólo tuviera un día. Al poner a uno de estos animales sobe 
el cristal del lado profundo, mostraban una conducta estereotipada característica. 
Se negaban a bajar las patas y retrocedían adoptando una postura de defensa, con 
las patas delanteras rígidas y flexionando las traseras. !$3 





181 Eleanor Gibson y Richard D. Walk, «The Visual Cliff», Scientific American, abril 1960; 
reimpreso en Perception Mechanisms and Models, W. H. Freeman and Company, San Fran- 
cisco, págs. 341-348. 


182 Ibíd., pág. 341. 
183 Ibíd., pág. 341. 
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Estos experimentos sugieren que una gran variedad de animales son 
capaces de reconocer algo como profundo antes de que el aprendizaje haya 
tenido lugar, antes de que sus respuestas hayan sido configuradas (por me- 
dio de varios procesos de realimentación; por ejemplo, caerse por el pre- 
cipicio) en señales que contienen información sobre la profundidad. Vie- 
nen a este mundo con un sistema de orientación que es sensible ya de un 
modo selectivo a información acerca de la profundidad. 

Los diferentes animales manifiestan esta reacción en edades caracte- 
rísticamente distintas. La edad en la que un animal presenta esta reacción 
está relacionada con su historia evolutiva: 


La supervivencia de una especie requiere que sus miembros desarrollen una 
discriminación hacia la profundidad para el momento en que adquieran una loco- 
moción independiente, sea en su primer día (el pollo y la cabra), a las tres o cuatro 
semanas (la rata y el gato) o entre los seis y diez meses (el ser humano). Es consis- 
tente con la teoría evolutiva el que tal capacidad vital (el reconocimiento de la 
profundidad) no dependa de posibles accidentes fatales durante el aprendizaje en 
las vidas de los individuos. !$* 


Por lo tanto, no es necesario que la estructura semántica pertinente 
desde un punto de vista funcional está actuando en el nacimiento para que 
pueda calificarse de concepto innato. La cuestión crucial está en si la es- 
tructura emerge durante la maduración normal independientemente del 
aprendizaje por prueba y error. «El simple hecho de que aparezca una con- 
ducta después de la infancia no significa necesariamente que sea apren- 
dida. Puede representar el despliegue natural de procesos innatos que están 
presentes en el desarrollo psicológico de un individuo. Llamamos a este 
proceso maduración, y podemos clasificarlo como una clase especial de 
conducta innata.!%, De la misma manera, podemos llamar concepto in- 
nato a aquella estructura interna que codifica de modo selectivo la infor- 
mación pertinente, y que es (en parte al menos) responsable de esta clase 
especial de conducta innata. 





184 Ibíd., pág. 343. 


185 Eckhard H. Hess, «Space Perception in the Chick», Perception: Mechanisms and Mo- 
dels, W. H. Freeman, San Francisco, págs. 367-371. 
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Por supuesto, no se debe confundir un concepto innato con la conducta 
que manifiesta ese concepto. Puede suceder, por ejemplo, que un orga- 
nismo tenga un concepto innato de profundidad, una estructura pertinente 
desde un punto de vista funcional que sea sensible de modo selectivo a la 
información acerca de la profundidad de las cosas, pero que, a causa de 
incapacidades motoras, desarrollo retardado o simple inmadurez, no pueda 
convertir con éxito estas creencias en una conducta adecuada. Recuérdese 
el caso de la salamandra que tenía las patas delanteras intercambiadas: cree 
que hay comida delante de ella, pero (por razones perfectamente compren- 
sibles) su conducta es bastante inapropiada a tal creencia. O bien conside- 
remos la siguiente clase de explicación plausible de por qué los bebés tí- 
picamente fracasan al tratar de coger objetos cercanos. 


El hecho de que los bebés al principio fracasen al tratar de coger objetos ha 
sido considerado a menudo como algo que mostraba que no podían percibir la pro- 
fundidad. Si, de hecho, pueden percibir la profundidad, entonces queda sin expli- 
carse esta incapacidad. Una pista para la explicación la da el hecho de que el cam- 
bio más obvio en el bebé a medida que se desarrolla es un cambio de tamaño. 
Parece verosímil que a un bebé que falla al intentar coger objetos le ocurra esto no 
a causa de una percepción deficiente de la profundidad, sino porque no sabe cuán 
largos son sus brazos. Dado que la longitud del brazo va cambiando drásticamente 
durante el desarrollo, no sería económico —en realidad no sería adaptativo— que 
el sistema motor-perceptivo estuviera ajustado desde el nacimiento una longitud 
de brazo determinada. !96 


Gibson y Walk advierten que no se deben dejar los bebés cerca de un 
borde aunque sepan distinguir muy bien la profundidad, porque es claro 
que su percepción de la profundidad madura mucho más rápidamente que 
sus habilidades locomotoras.'% En su tosco maniobrar para alcanzar el 
lado poco profundo del tablero, los bebés frecuentemente retrocedían ha- 
cia el lado profundo. Sin el cristal protector, habrían experimentado una 
dolorosa caída. 

Hemos argumentado que la clase de información a la que los estados 
internos (pertinentes desde un punto de vista funcional) son sensibles de 





186 T. G. R. Bower, «The Visual World of Infants», Perception: Mechanisms and Models, 
pág. 357. 


187 Óp, cit., pág. 341. 
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un modo selectivo es la que determina cuál sea el concepto que posee un 
individuo. En el caso de los conceptos primitivos adquiridos (aprendidos) 
la identidad del concepto (cuál es el concepto que el individuo tiene) está 
completamente determinada por la clase de información que le es asequi- 
ble durante el proceso de aprendizaje. Puesto que los conceptos innatos no 
se forman en respuesta a las señales portadoras de información durante la 
historia del individuo, no es posible identificar el concepto identificando 
la clase de información a la que se sensibilizó al individuo durante el 
aprendizaje. La identificación de los conceptos innatos (es decir, cuál sea 
el concepto que tiene un animal determinado) debe tener en cuenta nece- 
sariamente la manera en que esa estructura se desarrolla en la especie a la 
que pertenece el animal. Así pues, para los conceptos innatos la cuestión 
se transforma en: ¿qué información proyectó el proceso de selección natu- 
ral que llevará esa estructura en forma completamente digitalizada? ¿Cuál 
es el contenido semántico de las estructuras cognitivas que se formaron, 
conservaron y transmitieron genéticamente debido a su valor adaptativo? 
Es la herencia informativa, tanto de las estructuras adquiridas como de las 
innatas, lo que determina su identidad conceptual. En el caso de los con- 
ceptos adquiridos, los antecedentes informativos pertinentes se tienen que 
encontrar en el período de aprendizaje durante el cual el individuo adquirió 
el concepto. En el caso de los conceptos innatos, los antecedentes infor- 
mativos son los que actuaron en el desarrollo evolutivo de las estructuras 
cognitivas heredadas. 

Puesto que una estructura debe su desarrollo evolutivo a su utilidad 
adaptativa, y ésta a la adecuación de las respuestas que provoca, el signi- 
ficado de una estructura innata está, en esta medida, directamente relacio- 
nado con los efectos sobre la conducta. Sin embargo, incluso aquí, no es 
la clase de conducta que estas estructuras producen lo que determina su 
significado o contenido. Tanto las estructuras cognitivas adquiridas como 
las innatas derivan su significado de su origen informativo. Las estructuras 
internas sensibles a la información difícilmente podrían sobrevivir y pros- 
perar si no tuvieran una función útil desde un punto de vista adaptativo — 
es decir, a no ser que se resolvieran en algún tipo de conducta adecuada 
—, pero no es de la adecuación de la respuesta de donde una estructura 
deriva su contenido. Las respuestas apropiadas, como el buen gobierno, 
únicamente hacen posible que sobreviva y se desarrolle algo que extrae su 
significado de algún otro lugar. 
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CONOCIMIENTO E INFORMACION 
ARNO 


La información es una forma de describir la relevancia que 
tienen los sucesos que carecen de un significado intrínseco. 
Esta manera filosófica de definir la información es la base 
conceptual de este libro. 

Se suele oír hablar y escribir de información a los psicólogos 
cognitivos y alos profesores de informática, no a los filósofos. 
Es por ello que el autor trata de enfocar el tema de la 
información bajo un punto de vista particular y original. 

La primera parte del libro describe las ideas fundamentales de 
la teoría de la comunicación. La segunda parte analiza el 
contenido informativo de una señal a la vez que lanza un 
desafío escéptico de este contenido; finalmente hace una 
distinción entre los procesos sensoriales (ver un objeto) y los 
procesos cognitivos (reconocerle como tal). 

La última parte del libro se dedica al análisis de la creencia, 
los conceptos y el significado (en la medida en que éste se 
entiende como propiedad del estado psicológico). 
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